Liste der für Vits relevanten Repositories
Der Autor versteht nichts über maschinelles Lernen und dieser Text kann viele Fehler enthalten. Wenn der Code öffentlich verfügbar ist, muss die GitHub -Verbindung beigefügt sein. Ich bin sicher, dass es hier noch viele großartige Repositorys gibt. Entschuldigung, ich hatte keine Zeit.
Original
- Jaywalnut310/vits: vits: bedingter Variations-Autocoder mit kontroversem Lernen für End-to-End-Text-zu-Sprache
Verändert
Softvc
Das Ersetzen von VITS ' TextEncoder durch HuBERT ContentEncoder eliminiert die Notwendigkeit, Phonemsequenzen einzugeben (dh die Sprachabhängigkeit eliminieren). HuBERT ist Teil von SoftVC .
- Innnky/SO-Vits-SVC: 基于 vits 与 Softvc 的歌声音色转换模型
- QuickVC/QuickVC-VoiceConversion: QuickVC: Any-to-viele-Sprachumwandlung mit inverser Kurzzeit-Fourier-Transformation für eine schnellere Konvertierung
- Cjangcjengh/Moegoe: Ausführbare Datei für Vits Inferenz (Softvc/W2v2)
- PlayVoice/VI-SVC: Vits singende Sprachkonvertierung basierend auf PPG & Hubert ; Gesangsstimmklon;
- Francis-Komizu/Sovits: Eine Implementierung der Kombination von Soft-VC und Vits veraltet
- VTUBER-PLAN/VCVITS: Nicht parallele Sprachumwandlung basierend auf Vits
ISTFT (umgekehrte Kurzzeit-Fourier-Transformation)
Die Leistung wird verbessert, indem der Decoder, der Engpass war, mit Multiband-Generation und inverser Kurzzeit-Fourier-Transformation verbessert wurde.
- QuickVC/QuickVC-VoiceConversion: QuickVC: Any-to-viele-Sprachumwandlung mit inverser Kurzzeit-Fourier-Transformation für eine schnellere Konvertierung
- Masayakawamura/MB-ISTFT-Vits: Leichte und hochwertige End-to-End-Text-zu-Sprache mit Multi-Band-Generation und inverse Kurzzeit-Fourier-Transformation
- HCY71O/MB-ISTFT-VITS-WITH-AUTOVOCODER: Autovokoder in MB-ISTFT-Vits einbeziehen
- [2206.00208] Adavits: Tiny Vits für die Anpassung von Ressourcenlautsprechern mit niedrigem Computer -Lautsprecher
Andere Verbesserungen
- Innnky/Visspeech: 基于 vits fastspeech2 Visinger 的 tts 模型
- Codejin/vits_diffusion
- HCY71O/SC-Vits: Vits-basierte Null-Shot-TTS-System, das sich mit verschiedenen Methoden zur Konditionierungsmethoden im Stil/der Lautsprecher variiert.
- Innnky/Emotional-Vits: 无需情感标注的情感可控语音合成模型 , 基于 vits
- Olawod/Freevc: Freevc: Auf dem Weg zu qualitativ hochwertiger textfreier One-Shot-Sprachumwandlung
- EDESSON/YOUTTS: YOUTTS: Auf dem Weg zu Null-Shot-Multi-Sprecher-TTs und Null-Shot-Sprachumwandlung für alle, die zuvor entwickelt wurden, die zuvor entwickelte.
Andere Sprachen
- Francis-Komizu/Vits: ACG Text-to-Speech
- Francis-Komizu/Vits-Bilingual: Chinesisch-japanische zweisprachige Text-zu-Sprache
- HCY71O/SC-Vits: Vits-basierte Null-Shot-TTS-System, das sich mit verschiedenen Methoden zur Konditionierungsmethoden im Stil/der Lautsprecher variiert.
- Rotten-Work/Vits-Mandarin-Windows: Vits für Mandarin. Unterstützen Sie Windows und Linux-, Low-End- und High-End-Hardware
- Alexandajerry/Vits-Mandarin-Biaobei: Anwendung von Vits auf Mandarin TTS
- Cjangcjengh/Vits: Vits Implementierung von Japanisch, Chinesisch, Koreanisch, Sanskrit und Thai
- ISLETENNOS/MMVC_TRAINER: AI を使ったリアルタイムボイスチェンジャー (Trainer)
- [2211.09365] Die mongolische Sprachsynthese mit niedriger Ressourcen basiert auf automatischer Prosodie-Annotation
- Periode vits
Refaktiert
Da Refactoring Zeit braucht, werden die neuesten Technologien nicht immer in diesen Repositorys übernommen. Diese sollten jedoch leichter verwendet werden.
- Coqui-ai/tts:? -Ein Deep-Learning-Toolkit für Text-to-Speech, der in Forschung und Produktion gekämpft hat
- ESPNET/ESPNET: End-to-End-Sprachverarbeitungs-Toolkit
Andere
GUIs und vorgeborene Modelle
- Cjangcjengh/Moegoe_Gui: GUI für Moegoe
- Francis-Komizu/Stellavoicechanger: Tief-Learning-basierter Sprachwechsler, der lokale Inferenz unterstützt.
- Luyily /Moetts: Sprachsynthesemodell /Inferenz-GUI-Repo für Galgame-Zeichen basierend auf Tacotron2, HiFigan, Vits und Diff-SVC
- Thekog/Gal-Voice-Bot
Integration mit LLM
- Parawers/vits_with_chatgpt-gpt3
- Minami-yuduru/-chatgpt_vits: 一个使用 openai 接口链接 vits 模型的语音对话系统 GUI
Artikel, großartige Listen, Nachrichten
- VoiceConversionLab (@VoiceConversion) / Twitter
- ZZW922CN/Awesome-Speech-Rekognition-Speech-Synthesepaper: Automatische Spracherkennung (ASR), Sprecherverifizierung, Sprachsynthese, Text-zu-Sprache (TTS), Sprachmodellierung, Gesangs-Sprachsynthese (SVS), Voice Conversion (VC)
- Suche | ARXIV E-Print Repository
- Suche | ARXIV E-Print Repository
- "Vits" - Google -Suche
- Suche · vits
- 【機械学習】 vits でアニメ声へ変換できるボイスチェンジャー & 読み上げ器を作った話 - Qiita
- 2021 年 6 月に発表された最新の音声合成手法「 vits 」でアニメ風合成音声を作ってみた【つくよみちゃんコーパス】