Le système de génération de voix basé sur la récupération vers le système de parole est un texte basé sur Python vers la parole qui repose sur deux parties de base. Pour pouvoir générer une parole, il s'appuie sur Tacotron pour convertir le texte en parole, puis utilise la conversion vocale RVC pour pouvoir le faire ressembler à n'importe quel caractère sans avoir besoin d'utiliser un fichier audio.
Ce TTS a été testé sur Python 3.10, mais pourrait fonctionner sur d'autres versions.
Vous devez avoir la dernière version 64 bits Espeak NG.
Afin de construire la dépendance Fairseq, vous devez avoir Visual Studio et installer le package de développement "Desktop Development with C ++".
Pour l'utiliser, installez la poésie et installez les exigences avec poetry install --no-root , puis téléchargez le modèle Hubert, le modèle Tacotron avant et tout modèle RVC. Vous pouvez ensuite les placer dans le dossier du modèle avec les noms correspondants:
hubert_base.pt -> hubert.ptforward_steps90k.pt -> forward.pt(rvc .pth model name) -> rvc_model.pth(rvc .index model name) -> rvc_index.index (facultatif) Une fois que vous avez tous ces éléments, vous pouvez exécuter le fichier RVG.py avec vos arguments souhaités sur CLI, exécuter le fichier sans aucun argument pour lancer le Gradio WebUI ou vous pouvez inclure ce code dans votre propre projet et importer la fonction rvg_tts à partir de RVG.py
Afin d'utiliser une langue différente, un nouveau modèle de tacotron avant doit être formé. C'est quelque chose que je ne peux pas faire sans jeu de données. C'est là que je demande de l'aide à la communauté. Si vous pouvez fournir un ensemble de données, veuillez le faire.
Forward Tacotron est autorisé en vertu de la licence du MIT
RVC WebUI est concédé sous licence MIT
Copyright 2023 FOFIFY52
Licencié sous la licence Apache, version 2.0 (la "licence"); Vous ne pouvez pas utiliser ce fichier sauf conforme à la licence. Vous pouvez obtenir une copie de la licence à
http://www.apache.org/licenses/LICENSE-2.0
Sauf exiger la loi applicable ou convenu par écrit, les logiciels distribués en vertu de la licence sont distribués sur une base «tel quel», sans garantie ou conditions d'aucune sorte, expresse ou implicite. Voir la licence pour la langue spécifique régissant les autorisations et les limitations sous la licence.