awesome vits Download - awesome vits Source Code Download

awesome vits

AI-Quellcode

1.0.0

Herunterladen

Liste der für Vits relevanten Repositories

Der Autor versteht nichts über maschinelles Lernen und dieser Text kann viele Fehler enthalten. Wenn der Code öffentlich verfügbar ist, muss die GitHub -Verbindung beigefügt sein. Ich bin sicher, dass es hier noch viele großartige Repositorys gibt. Entschuldigung, ich hatte keine Zeit.

Original

Jaywalnut310/vits: vits: bedingter Variations-Autocoder mit kontroversem Lernen für End-to-End-Text-zu-Sprache

Verändert

Softvc

Das Ersetzen von VITS ' TextEncoder durch HuBERT ContentEncoder eliminiert die Notwendigkeit, Phonemsequenzen einzugeben (dh die Sprachabhängigkeit eliminieren). HuBERT ist Teil von SoftVC .

Innnky/SO-Vits-SVC: 基于 vits 与 Softvc 的歌声音色转换模型
QuickVC/QuickVC-VoiceConversion: QuickVC: Any-to-viele-Sprachumwandlung mit inverser Kurzzeit-Fourier-Transformation für eine schnellere Konvertierung
Cjangcjengh/Moegoe: Ausführbare Datei für Vits Inferenz (Softvc/W2v2)
PlayVoice/VI-SVC: Vits singende Sprachkonvertierung basierend auf PPG & Hubert ； Gesangsstimmklon;
Francis-Komizu/Sovits: Eine Implementierung der Kombination von Soft-VC und Vits veraltet
VTUBER-PLAN/VCVITS: Nicht parallele Sprachumwandlung basierend auf Vits

ISTFT (umgekehrte Kurzzeit-Fourier-Transformation)

Die Leistung wird verbessert, indem der Decoder, der Engpass war, mit Multiband-Generation und inverser Kurzzeit-Fourier-Transformation verbessert wurde.

QuickVC/QuickVC-VoiceConversion: QuickVC: Any-to-viele-Sprachumwandlung mit inverser Kurzzeit-Fourier-Transformation für eine schnellere Konvertierung
Masayakawamura/MB-ISTFT-Vits: Leichte und hochwertige End-to-End-Text-zu-Sprache mit Multi-Band-Generation und inverse Kurzzeit-Fourier-Transformation
HCY71O/MB-ISTFT-VITS-WITH-AUTOVOCODER: Autovokoder in MB-ISTFT-Vits einbeziehen
[2206.00208] Adavits: Tiny Vits für die Anpassung von Ressourcenlautsprechern mit niedrigem Computer -Lautsprecher

Andere Verbesserungen

Innnky/Visspeech: 基于 vits fastspeech2 Visinger 的 tts 模型
Codejin/vits_diffusion
HCY71O/SC-Vits: Vits-basierte Null-Shot-TTS-System, das sich mit verschiedenen Methoden zur Konditionierungsmethoden im Stil/der Lautsprecher variiert.
Innnky/Emotional-Vits: 无需情感标注的情感可控语音合成模型，基于 vits
Olawod/Freevc: Freevc: Auf dem Weg zu qualitativ hochwertiger textfreier One-Shot-Sprachumwandlung
EDESSON/YOUTTS: YOUTTS: Auf dem Weg zu Null-Shot-Multi-Sprecher-TTs und Null-Shot-Sprachumwandlung für alle, die zuvor entwickelt wurden, die zuvor entwickelte.

Andere Sprachen

Francis-Komizu/Vits: ACG Text-to-Speech
Francis-Komizu/Vits-Bilingual: Chinesisch-japanische zweisprachige Text-zu-Sprache
HCY71O/SC-Vits: Vits-basierte Null-Shot-TTS-System, das sich mit verschiedenen Methoden zur Konditionierungsmethoden im Stil/der Lautsprecher variiert.
Rotten-Work/Vits-Mandarin-Windows: Vits für Mandarin. Unterstützen Sie Windows und Linux-, Low-End- und High-End-Hardware
Alexandajerry/Vits-Mandarin-Biaobei: Anwendung von Vits auf Mandarin TTS
Cjangcjengh/Vits: Vits Implementierung von Japanisch, Chinesisch, Koreanisch, Sanskrit und Thai
ISLETENNOS/MMVC_TRAINER: AI を使ったリアルタイムボイスチェンジャー (Trainer)
[2211.09365] Die mongolische Sprachsynthese mit niedriger Ressourcen basiert auf automatischer Prosodie-Annotation
Periode vits

Refaktiert

Da Refactoring Zeit braucht, werden die neuesten Technologien nicht immer in diesen Repositorys übernommen. Diese sollten jedoch leichter verwendet werden.

Coqui-ai/tts:? -Ein Deep-Learning-Toolkit für Text-to-Speech, der in Forschung und Produktion gekämpft hat
ESPNET/ESPNET: End-to-End-Sprachverarbeitungs-Toolkit

Andere

GUIs und vorgeborene Modelle

Cjangcjengh/Moegoe_Gui: GUI für Moegoe
Francis-Komizu/Stellavoicechanger: Tief-Learning-basierter Sprachwechsler, der lokale Inferenz unterstützt.
Luyily /Moetts: Sprachsynthesemodell /Inferenz-GUI-Repo für Galgame-Zeichen basierend auf Tacotron2, HiFigan, Vits und Diff-SVC
Thekog/Gal-Voice-Bot

Integration mit LLM

Parawers/vits_with_chatgpt-gpt3
Minami-yuduru/-chatgpt_vits: 一个使用 openai 接口链接 vits 模型的语音对话系统 GUI

Artikel, großartige Listen, Nachrichten

VoiceConversionLab (@VoiceConversion) / Twitter
ZZW922CN/Awesome-Speech-Rekognition-Speech-Synthesepaper: Automatische Spracherkennung (ASR), Sprecherverifizierung, Sprachsynthese, Text-zu-Sprache (TTS), Sprachmodellierung, Gesangs-Sprachsynthese (SVS), Voice Conversion (VC)
Suche | ARXIV E-Print Repository
Suche | ARXIV E-Print Repository
"Vits" - Google -Suche
Suche · vits
【機械学習】 vits でアニメ声へ変換できるボイスチェンジャー & 読み上げ器を作った話 - Qiita
2021 年 6 月に発表された最新の音声合成手法「 vits 」でアニメ風合成音声を作ってみた【つくよみちゃんコーパス】

Expandieren

Zusätzliche Informationen