El texto de generación de voz basado en la recuperación al sistema del habla es un texto basado en Python al habla que se basa en dos partes centrales. Para poder generar discurso, se basa en Tacotron para convertir el texto en discurso y luego utiliza la conversión de voz de RVC para poder que suene como cualquier carácter sin la necesidad de usar un archivo de audio.
Este TTS ha sido probado en Python 3.10, aunque podría funcionar en otras versiones.
Debe tener el último lanzamiento de 64 bits espeak ng.
Para construir la dependencia de FairSeq, debe tener Visual Studio e instalar el paquete de desarrollo "Desarrollo de escritorio con C ++".
Para usarlo, instale poesía e instale los requisitos con poetry install --no-root y luego descargue el modelo Hubert, el modelo de tacotron hacia adelante y cualquier modelo RVC. Luego puede colocarlos en la carpeta del modelo con los nombres correspondientes:
hubert_base.pt -> hubert.ptforward_steps90k.pt -> forward.pt(rvc .pth model name) -> rvc_model.pth(rvc .index model name) -> rvc_index.index (opcional) Una vez que tenga todo esto, puede ejecutar el archivo RVG.py con sus argumentos deseados sobre CLI, ejecute el archivo sin ningún argumento para iniciar el gradio webui o puede incluir este código en su propio proyecto e importar la función rvg_tts desde RVG.py
Para usar un lenguaje diferente, se debe capacitar un nuevo modelo de tacotrón delantero. Esto es algo que no puedo hacer sin un conjunto de datos. Aquí es donde le pido ayuda a la comunidad. Si puede proporcionar un conjunto de datos, hazlo.
Forward Tacotron tiene licencia bajo la licencia MIT
RVC WebUI tiene licencia bajo la licencia MIT
Copyright 2023 Foxify52
Licenciado bajo la licencia Apache, versión 2.0 (la "licencia"); No puede usar este archivo, excepto de conformidad con la licencia. Puede obtener una copia de la licencia en
http://www.apache.org/licenses/LICENSE-2.0
A menos que la ley aplicable sea requerida o acordado por escrito, el software distribuido bajo la licencia se distribuye de manera "como es", sin garantías o condiciones de ningún tipo, ya sea expresas o implícitas. Consulte la licencia para los permisos y limitaciones de rigor de idioma específico bajo la licencia.