Lista de repositorios relevantes para los VITs
El autor no entiende nada sobre el aprendizaje automático y este texto puede contener muchos errores. Si el código está disponible públicamente, se adjuntará el enlace GitHub. Estoy seguro de que hay muchos más repositorios excelentes que no figuran aquí. Lo siento, no tuve tiempo.
Original
- Jaywalnut310/VITS: VITS: Autoencoder de variacional condicional con aprendizaje adversario para texto a voz de extremo a extremo
Modificado
Blando
Reemplazar TextEncoder VITS con ContentEncoder de HuBERT elimina la necesidad de ingresar secuencias de fonemas (es decir, eliminar la dependencia del lenguaje). HuBERT es parte de SoftVC .
- Innnky/SO-VITS-SVC: 基于 Vits 与 Softvc 的歌声音色转换模型
- QuickVC/QuickVC-VoiceConversion: QuickVC: Conversión de voz de cualquiera a gran parte utilizando transformación inversa de Fourier a corto plazo para una conversión más rápida
- Cjangcjengh/MoeGoe: archivo ejecutable para inferencia VITS (SoftVC/W2V2)
- PlayVoice/VI-SVC: VITS Singing Voice Conversion basada en PPG y Hubert ; Singing Voice Clone;
- Francis-Komizu/Sovits: una implementación de la combinación de VC y VITS
- VTUBER-Plan/VCVITS: conversión de voz no paralela basada en VITS
ISTFT (transformación inversa de Fourier a corto plazo)
El rendimiento mejora al mejorar el decodificador, que fue el cuello de botella, con la generación multibanda y la transformación inversa de Fourier a corto plazo.
- QuickVC/QuickVC-VoiceConversion: QuickVC: Conversión de voz de cualquiera a gran parte utilizando transformación inversa de Fourier a corto plazo para una conversión más rápida
- Masayakawamura/MB-ESTFT-VITS: texto a voz de extremo a extremo ligero y de alta fidelidad con generación de bandas múltiples y transformación inversa de Fourier a corto plazo
- HCY71O/MB-ESTFT-VITS-With-Autovocoder: Incorporación de Autovocoder a MB-ESTFT-VITS
- [2206.00208] ADAVITS: VITs pequeños para la adaptación de altavoces de recursos informáticos bajos
Otras mejoras
- Innnky/Vispeech: 基于 Vits FastSpeech2 Visinger 的 TTS 模型
- CodEJin/VITS_DIFFUSION
- HCY71O/SC-VITS: sistema TTS de disparo cero basado en VITs que varía con diversos métodos de acondicionamiento de estilo/altavoz.
- Innnky/emocional: 无需情感标注的情感可控语音合成模型 基于 基于 Vits
- Olawod/FREEVC: FREEVC: Hacia la conversión de voz de una sola vez de alta calidad sin texto
- Edresson/YourTts: YourTts: Hacia TTS de múltiples disparadores cero y conversión de voz de cero disparos para todos la conversión de voz de cero disparo que se desarrolló anteriormente.
Otros idiomas
- Francis-Komizu/Vits: ACG Texto a voz
- Francis-Komizu/Vits-bilingüe: texto a voz bilingüe chino-japonés
- HCY71O/SC-VITS: sistema TTS de disparo cero basado en VITs que varía con diversos métodos de acondicionamiento de estilo/altavoz.
- Rotten-Work/Vits-Mandarin-Windows: Vits for Mandarin. Admite Windows y Linux, de gama baja y de alta gama Hardwares
- Alexandajerry/Vits-Mandarin-Biaobei: Aplicación de VITS en mandarín TTS
- Cjangcjengh/Vits: Vits Implementación de japonés, chino, coreano, sánscrito y tailandés
- isletennos/mmvc_trainer: ai を使ったリアルタイムボイスチェンジャー (entrenador)
- [2211.09365] Síntesis de discurso mongol de bajo recurso basada en la anotación de prosodia automática
- Vits de época
Refactorizado
Debido a que la refactorización lleva tiempo, las últimas tecnologías no siempre se adoptan en estos repositorios. Sin embargo, estos deberían ser más fáciles de usar.
- Coqui-Ai/TTS :? -Un conjunto de herramientas de aprendizaje profundo para texto a discurso, probado en investigación en investigación y producción
- ESPNET/ESPNET: Kit de herramientas de procesamiento de voz de extremo a extremo
Otros
GUIS y modelos previamente capacitados
- Cjangcjengh/moegae_gui: GUI para MoeGoe
- Francis-Komizu/Stellavoicechanger: cambiador de voz basado en el aprendizaje profundo, que respalda la inferencia local.
- Luoyily /Moetts: modelo de síntesis de voz /repositorio de GUI de inferencia para caracteres de Galgame basado en Tacotron2, Hifigan, VITS y Diff-SVC
- TheKog/Gal-Voice-Bot
Integración con LLM
- Paraworks/vits_with_chatgpt-gpt3
- Minami-yuduru/-chatgpt_vits: 一个使用 OpenAi 接口链接 Vits 模型的语音对话系统 Gui
Artículos, listas increíbles, noticias
- VoiceConversionLab (@voiceconversion) / Twitter
- ZZW922CN/Awesome-Speech-Disecneition-síntesis-síntesis-síntesis: reconocimiento automático de voz (ASR), verificación de hablantes, síntesis del habla, texto a voz (TTS), modelado de idiomas, síntesis de voz de canto (SVS), conversión de voz (VC)
- Búsqueda | Repositorio de impresión electrónica ARXIV
- Búsqueda | Repositorio de impresión electrónica ARXIV
- "Vits" - Search de Google
- Búsqueda · VITS
- 【機械学習】 Vits でアニメ声へ変換できるボイスチェンジャー & 読み上げ器を作った話 - Qiita
- 2021 年 6 月に発表された最新の音声合成手法「 Vits 」でアニメ風合成音声を作ってみた【つくよみちゃんコーパス】