Lista de repositórios relevantes para os Vits
O autor não entende nada sobre aprendizado de máquina e este texto pode conter muitos erros. Se o código estiver disponível ao público, o link do GitHub será anexado. Tenho certeza de que há muitos outros ótimos repositórios não listados aqui. Desculpe, não tive tempo.
Original
- Jaywalnut310/Vits: Vits: Autoencoder de Variação Condicional com Aprendizagem Adversária para Fencheto de Texto para End-Primeira
Modificado
Softvc
A substituição do TextEncoder do VITS pelo ContentEncoder de HuBERT elimina a necessidade de inserir sequências de fonemas (ou seja, eliminar a dependência da linguagem). HuBERT faz parte do SoftVC .
- Innnky/So-Vits-SVC: 基于 vits 与 softvc 的歌声音色转换模型
- QuickVC/QuickVC-VoiceConversão: QuickVC: qualquer conversão de voz para muitos usando transformada de Fourier de curto tempo inversa para conversão mais rápida
- Cjangcjengh/mogoe: arquivo executável para inferência de vits (softvc/w2v2)
- Playvoice/VI-SVC: Vits Singing Voice Conversão baseada em PPG & Hubert ; Clone de voz cantando;
- Francis-Komizu/Sovits: uma implementação da combinação de Soft-VC e Vits depreciados
- vtuber-plan/vcvits: conversão de voz não paralela com base em Vits
ISTFT (Transformação de Fourier de curto tempo inversa)
O desempenho é melhorado, melhorando o decodificador, que foi o gargalo, com geração multibanda e transformada de Fourier de curto tempo inversa.
- QuickVC/QuickVC-VoiceConversão: QuickVC: qualquer conversão de voz para muitos usando transformada de Fourier de curto tempo inversa para conversão mais rápida
- Masayakawamura/mb-idft-vits: Fidelidade leve e de alta fidelidade de ponta a ponta com geração de várias bandas e transformação de Fourier de curto tempo inversa
- HCY71O/MB-ISTFT-VITS-AS-AUTOVOCODER: Incorporando o Autovocoder a MB-ISTFT-Vits
- [2206.00208] Adavits: Tiny Vits para Adaptação de Alto -Alto de Recursos de Computação Baixo
Outras melhorias
- Innnky/Vispeech: 基于 vits fastspeech2 visinger 的 tts 模型
- Codejin/vits_diffusion
- HCY71O/SC-VITS: Sistema TTS Zero-Shot baseado em VITs variando com diversos métodos de condicionamento de estilo/alto-falante.
- Innnky/Vits emocionais: 无需情感标注的情感可控语音合成模型 , 基于 vits
- OLAWOD/FREEVC: FREEVC: Rumo à conversão de voz sem texto de alta qualidade
- Edresson/yourtts: yourtts: em direção a Zero Shot TTS multi-falante e conversão de voz com tiro zero para todos conversão de voz com tiro zero que se desenvolveu anteriormente.
Outros idiomas
- Francis-Komizu/Vits: ACG Text-to-fala
- Francis-Komizu/Vits-bilíngüe: Chinês-Japanese Bilíngue Texto para Fala
- HCY71O/SC-VITS: Sistema TTS Zero-Shot baseado em VITs variando com diversos métodos de condicionamento de estilo/alto-falante.
- Rotten-Work/Vits-Mandarin-Windows: Vits para mandarim. Suporte ao Windows e Linux, Hardwares de ponta e de ponta
- Alexandajerry/Vits-Mandarin-Biaobei: Aplicação de Vits no Mandarin TTS
- Cjangcjengh/Vits: Vits Implementação de japonês, chinês, coreano, sânscrito e tailandês
- ISLETENNOS/MMVC_TRAINER: AI を使ったリアルタイムボイスチェンジャー (treinador)
- [2211.09365] Síntese de fala da Mongólia de baixo recurso com base na anotação de prosódia automática
- Período vits
Refatorado
Como a refatoração leva tempo, as tecnologias mais recentes nem sempre são adotadas nos repositórios de teses. No entanto, eles devem ser facilitados de usar.
- coqui-ai/tts :? -Um kit de ferramentas de aprendizado profundo para o texto em fala, testado em batalha em pesquisa e produção
- ESPNET/ESPNET: Kit de ferramentas de processamento de fala de ponta a ponta
Outros
GUIs e modelos pré-treinados
- Cjangcjengh/mogoe_gui: gui for moegoe
- Francis-Komizu/Stellavoicechanger: Changer de voz baseado em aprendizado profundo, apoiando a inferência local.
- Luoyily /Moetts: Modelo de Síntese de Fala /Inferência GUI Repo para caracteres Galgame baseado em Tacotron2, Hifigan, Vits e Diff-SVC
- Thekog/gal-voice-bot
Integração com LLM
- Paraworks/vits_with_chatgpt-gpt3
- Minami-yuduru/-chatgpt_vits: 一个使用 openi 接口链接 vits 模型的语音对话系统 gui
Artigos, listas incríveis, notícias
- VoiceConversionLab (@VoiceConversion) / Twitter
- ZZW922CN/Awesome-Recognição-Reconhecion-Síntese-Papões: Reconhecimento Automático de Speech (ASR), Verificação de Alto-falantes, Síntese de Funcionários, Texto-Discurso (TTS), Modelagem de Linguagem, Síntese de Voz Singing (SVS), Conversão de Voz (VC)
- Pesquisa | Repositório de impressão E Arxiv
- Pesquisa | Repositório de impressão E Arxiv
- "Vits" - Pesquisa do Google
- Pesquisa · Vits
- 【機械学習】 Vits でアニメ声へ変換できるボイスチェンジャー & 読み上げ器を作った話 - qiita
- 2021 年 6 月に発表された最新の音声合成手法「 vits 」でアニメ風合成音声を作ってみた【つくよみちゃんコーパス】