
Papel | Site
Como detalhamos em nosso artigo e site, as vantagens do OpenVoice são três vezes:
1. Clonagem de cor precisa de tom. O OpenVoice pode clonar com precisão a cor do tom de referência e gerar fala em vários idiomas e sotaques.
2. Controle flexível de estilo de voz. O OpenVoice permite o controle granular sobre os estilos de voz, como emoção e sotaque, além de outros parâmetros de estilo, incluindo ritmo, pausas e entonação.
3. Clonagem de voz transversal com tiro zero. Nenhuma do idioma do discurso gerado nem o idioma do discurso de referência precisam ser apresentados no conjunto de dados de treinamento multilíngue de alto-falante.
Em abril de 2024, lançamos o OpenVoice V2, que inclui todos os recursos no V1 e possui:
1. Melhor qualidade de áudio. O OpenVoice V2 adota uma estratégia de treinamento diferente que oferece melhor qualidade de áudio.
2. Suporte multilingual nativo. Inglês, espanhol, francês, chinês, japonês e coreano são apoiados nativamente no OpenVoice V2.
3. Uso comercial gratuito. A partir de abril de 2024, o V2 e o V1 são liberados sob licença do MIT. Grátis para uso comercial.
O OpenVoice vem alimentando a capacidade instantânea de clonagem de voz do myshell.ai desde maio de 2023. Até novembro de 2023, o modelo de clonagem de voz tem sido usado dezenas de milhões de vezes pelos usuários em todo o mundo e testemunhou o crescimento explosivo do usuário na plataforma.
Consulte o uso para obter instruções detalhadas.
Consulte o controle de qualidade para perguntas e respostas comuns. Atualizaremos regularmente a lista de perguntas e respostas.
@article{qin2023openvoice,
title={OpenVoice: Versatile Instant Voice Cloning},
author={Qin, Zengyi and Zhao, Wenliang and Yu, Xumin and Sun, Xin},
journal={arXiv preprint arXiv:2312.01479},
year={2023}
}
OpenVoice V1 e V2 são licenciados pelo MIT. Grátis para uso comercial e de pesquisa.
Essa implementação é baseada em vários excelentes projetos, TTS, VITs e Vits2. Obrigado pelo seu trabalho incrível!