Clone un discours de voix et de sortie dans une autre langue avec la voix d'origine.
Python 3.7 est recommandé. Python 3.7 est requis , en raison de la version de TensorFlow utilisée dans ce projet.
python3 -m venv pyvenv
Activer l'environnement virtuel: Windows: ./pyvenv/Scripts/activate macOS / Linux: source pyvenv/bin/activate
Désactiver l'environnement virtuel: deactivate
Remarque: votre environnement virtuel Python peut entraîner des problèmes lors de l'exécution de l'interface utilisateur.
Une fois installé, extraire le dossier et ajouter <ffmpeg folder path>/bin sur le chemin.
pip3 install -r requirements.txt
Une fois téléchargé, ajoutez les modèles (* .pt) à CogNative/CogNative/models/RTVC/saved_models/default
Le dossier TACO_PRÉTRAINE (y compris le dossier lui-même) doit être téléchargé et ajouté à CogNative/CogNative/models/RTVCSwedish/synthesizer/saved_models/swedish
credentials.json dans le répertoire de niveau supérieur. Il y a actuellement un fichier nommé credentials.json.template , votre credentials.json doit correspondre aux paires de touches / valeur affichées. Commencez par le répertoire des racines cognitives.
Pour lancer GUI, exécutez python -m CogNative.testUI.UI
Tous les drapeaux nécessaires qui ne sont pas spécifiés entraîneront une réponse invite à laquelle il faut répondre avant de continuer. Des exemples suivent.
python -m CogNative.main -help CogNative CLI FLags:
-sampleAudio <PATH>: audio file of voice to clone
-synType <text, audio>: synthesis mode either given input text or by transcribing audio file
[-dialogueAudio] <PATH>: for audio synType, audio file of dialogue to speak
[-dialogueText] <PATH>: for text synType, text string of dialogue to speak
-out <PATH>: output audio file path
-useExistingEmbed <y/yes/n/no>: Uses saved embedding of previously used voice samples if enabled and present.
python -m CogNative.main -sampleAudio CogNative/examples/MatthewM66.wav -synType text -dialogueText "The turbo-encabulator has now reached a high level of development, and it's being successfully used in the operation of novertrunnions." -out cmdExampleText.wav -useExistingEmbed y Loaded encoder "english_encoder.pt" trained to step 1564501
Synthesizer using device: cuda
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at CogNativemodelsRTVCsaved_modelsdefaultvocoder.pt
Synthesizing...
Clone output to cmdExampleText.wav
python -m CogNative.main -sampleAudio CogNativeexamplesMatthewM66.wav -synType audio -dialogueAudio CogNativeexamplesBillMaher22.wav -out cmdExampleAudio.wav -useExistingEmbed n Loaded encoder "english_encoder.pt" trained to step 1564501
Synthesizer using device: cuda
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at CogNativemodelsRTVCsaved_modelsdefaultvocoder.pt
Loading requested file...
Synthesizing...
Clone output to cmdExampleAudio.wav
Ce script traduira l'audio d'une langue prise en charge vers l'anglais. Pour utiliser le script Autotranslate sur Windows, faites glisser et déposez un fichier audio sur le script ou placez un raccourci vers le script dans %AppData%MicrosoftWindowsSendTo et utilisez la fonction "Send to" Menu context sur un fichier audio à traduire. Dans les deux cas, un nouveau fichier .wav avec le nom de fichier original suivi de "_ + Destination Language" sera placé dans le même dossier. Pour d'autres plates-formes, les mêmes indicateurs CLI doivent être utilisés, mais les détails sur l'intégration du menu contextuel varieront selon les packages installés.
git branch yourname-feature-nameCe guide de style est important pour s'assurer que tout style correspond tout au long du projet. Pour styliser votre code, veuillez utiliser le Styler Black Python.
Fichier unique: black <python-file-name> Tous les fichiers: black .
Ce référentiel GitHub sert de base de notre module de clonage vocal.
Clongeur en temps réel
Voir la licence ici.
Ce référentiel GitHub a formé le synthétiseur suédois.
Suédois à voix réelle