Liste des référentiels pertinents pour les vites
L'auteur ne comprend rien sur l'apprentissage automatique et ce texte peut contenir de nombreuses erreurs. Si le code est accessible au public, le lien github doit être joint. Je suis sûr qu'il y a beaucoup d'autres grands référentiels non répertoriés ici. Désolé, je n'ai pas eu le temps.
Original
- Jaywalnut310 / VITS: VITS: Autoencoder variationnel conditionnel avec apprentissage contradictoire pour le texte à la recherche de bout en bout
Modifié
Softvc
Le remplacement TextEncoder VITS par ContentEncoder de HuBERT élimine la nécessité de saisir des séquences de phonèmes (c'est-à-dire d'éliminer la dépendance du langage). HuBERT fait partie de SoftVC .
- innnky / so-vits-svc: 基于 vits 与 softvc 的歌声音色转换模型
- QuickVC / QuickVC-VoiceConversion: QuickVC: Conversion vocale tout-à-plusieurs utilisant une transformée de Fourier à court terme inverse pour une conversion plus rapide
- Cjangcjengh / Moegoe: Fichier exécutable pour l'inférence VITS (softvc / w2v2)
- PlayVoice / vi-svc: vits la conversion de chant vocale basée sur PPG & Hubert ; Singing Voice Clone;
- Francis-Komizu / Sovits: une mise en œuvre de la combinaison de Soft-VC et VITS déconnecté
- Vtuber-plan / VCVits: Conversion vocale non parallèle basée sur les vites
ISTFT (transformée de Fourier à court terme inverse)
Les performances sont améliorées en améliorant le décodeur, qui était le goulot d'étranglement, avec une génération multibande et une transformée de Fourier à court terme inverse.
- QuickVC / QuickVC-VoiceConversion: QuickVC: Conversion vocale tout-à-plusieurs utilisant une transformée de Fourier à court terme inverse pour une conversion plus rapide
- Masayakawamura / Mb-Istft-Vits: Text-to-voca-voca-to-voca-to-vocawear poids léger et haute fidélité avec génération multi-bandes et transformée de Fourier à court terme inverse
- HCY71O / Mb-Istft-vits-with-AutovoDer: Incorporation de l'autovocoder à MB-Istft-vits
- [2206.00208] Adavits: Tiny Vits for Low Computing Resource Enceinte Adaptation
Autres améliorations
- Innnky / Vispeech: 基于 Vit FastSpeech2 Visinger 的 TTS 模型
- Codejin / vits_diffusion
- HCY71O / SC-VITS: Système TTS zéro basé sur des vites variant avec diverses méthodes de conditionnement de style / haut-parleur.
- innnky / émotionnels-vits: 无需情感标注的情感可控语音合成模型 , 基于 vits
- Olawod / FreeVC: FreeVC: Vers une conversion vocale sans texte de haute qualité
- EDRESSON / YOTTTS: YOTTTS: Vers des TT multi-pardes multiples et une conversion vocale zéro pour la conversion vocale zéro qui s'est développée plus tôt.
Autres langues
- Francis-Komizu / VITS: ACG Text-to-dispection
- Francis-Komizu / VITS-Bilingue: Texte à vocation bilingue chinois-japonais
- HCY71O / SC-VITS: Système TTS zéro basé sur des vites variant avec diverses méthodes de conditionnement de style / haut-parleur.
- Rotten-Work / Vits-Mandarin-Windows: VITS POUR MANDARIN. Prise en charge des Windows et Linux, des wares de dureté haut de gamme et haut de gamme
- Alexandajerry / VITS-MANDARIN-BIAOBEI: Application des vites sur Mandarin TTS
- Cjangcjengh / VITS: VITS Implémentation de japonais, chinois, coréen, sanskrit et thaï
- Isletensos / MMVC_TRAINER: AI を使ったリアルタイムボイスチェンジャー (Trainer)
- [2211.09365] synthèse de la parole mongole à faible ressource basée sur l'annotation automatique de la prosodie
- VITSES DE PÉRIODE
Refactorisé
Parce que le refactorisation prend du temps, les dernières technologies ne sont pas toujours adoptées dans ces référentiels. Cependant, ceux-ci devraient être facilités à utiliser.
- Coqui-ai / tts :? - Une boîte à outils d'apprentissage en profondeur pour le texte à la disposition, testée au combat dans la recherche et la production
- ESPNET / ESPNET: boîte à outils de traitement de la parole de bout en bout
Autres
GUIS et modèles pré-formés
- Cjangcjengh / Moegoe_Gui: GUI pour Moegoe
- Francis-Komizu / StellavoiceChanger: Changeur de voix basé sur un apprentissage profond, soutenant l'inférence locale.
- Luoyily / MOETTS: Modèle de synthèse de la parole / repo GUI d'inférence pour les caractères Galgame basés sur Tacotron2, Hifigan, VITS et DIFF-SVC
- Thekog / gal-voice-bot
Intégration avec LLM
- Paraworks / vits_with_chatgpt-gpt3
- Minami-yuduru / -chatgpt_vits: 一个使用 Openai 接口链接 VITS 模型的语音对话系统 GUI
Articles, listes impressionnantes, nouvelles
- VoiceConversionLab (@VoiceConversion) / Twitter
- ZZW922CN / Awesome-Speech-Recognition-Speech-Synthesis-Papers: Automatic Speech Recognition (ASR), Speaker Verification, Speech Synthesis, Text-to-Speech (TTS), Language Modélisation, Singing Voice Synthesis (SVS), Conversion vocale (VC)
- Rechercher | Référentiel d'impression ERXIV
- Rechercher | Référentiel d'impression ERXIV
- "VITS" - Recherche Google
- Rechercher · VITS
- 【機械学習】 VITS でアニメ声へ変換できるボイスチェンジャー & 読み上げ器を作った話 - Qiita
- 2021 年 6 月に発表された最新の音声合成手法「 VITS 」でアニメ風合成音声を作ってみた【つくよみちゃんコーパス】