Téléchargement CogNative - Téléchargement du code source CogNative

CogNative

Code Source AI

1.0.0

Télécharger

Cognitif

Synthèse vocale traduite

Clone un discours de voix et de sortie dans une autre langue avec la voix d'origine.

Installation

1. Installez Python:

Python 3.7 est recommandé. Python 3.7 est requis , en raison de la version de TensorFlow utilisée dans ce projet.

2. Créer un environnement virtuel (facultatif):

python3 -m venv pyvenv

Activer l'environnement virtuel: Windows: ./pyvenv/Scripts/activate macOS / Linux: source pyvenv/bin/activate

Désactiver l'environnement virtuel: deactivate

Remarque: votre environnement virtuel Python peut entraîner des problèmes lors de l'exécution de l'interface utilisateur.

3. Installez FFMPEG.

Une fois installé, extraire le dossier et ajouter <ffmpeg folder path>/bin sur le chemin.

4. Installer Pytorch:

Pytorch Build: Stable (1.11.0).
Votre système d'exploitation: Choisissez le système d'exploitation dans lequel votre environnement est cognitif (Windows ou Linux recommandé).
Package: Choisissez le programme d'installation du package que vous utilisez (PIP recommandé).
Langue: Python.
Plate-forme de calcul: CUDA 11.3 recommandé. Si vous n'avez pas de processeur GPU, choisissez.

5. Installer les packages Python requis:

pip3 install -r requirements.txt

6. Installer des modèles.

Une fois téléchargé, ajoutez les modèles (* .pt) à CogNative/CogNative/models/RTVC/saved_models/default

Le dossier TACO_PRÉTRAINE (y compris le dossier lui-même) doit être téléchargé et ajouté à CogNative/CogNative/models/RTVCSwedish/synthesizer/saved_models/swedish

7. Créer des informations d'identification Google Cloud:

Suivez les étapes pour configurer Google Cloud Indementiels.
Ajoutez Google Identials à credentials.json dans le répertoire de niveau supérieur. Il y a actuellement un fichier nommé credentials.json.template , votre credentials.json doit correspondre aux paires de touches / valeur affichées.

Usage

Commencez par le répertoire des racines cognitives.

Gui

Pour lancer GUI, exécutez python -m CogNative.testUI.UI

CLI

Tous les drapeaux nécessaires qui ne sont pas spécifiés entraîneront une réponse invite à laquelle il faut répondre avant de continuer. Des exemples suivent.

Afficher le message d'aide: python -m CogNative.main -help

 CogNative CLI FLags:
    -sampleAudio <PATH>: audio file of voice to clone
    -synType <text, audio>: synthesis mode either given input text or by transcribing audio file
    [-dialogueAudio] <PATH>: for audio synType, audio file of dialogue to speak
    [-dialogueText] <PATH>: for text synType, text string of dialogue to speak
    -out <PATH>: output audio file path
    -useExistingEmbed <y/yes/n/no>: Uses saved embedding of previously used voice samples if enabled and present.

Générer la voix clonée à partir de l'exemple d'entrée vocale et de texte: python -m CogNative.main -sampleAudio CogNative/examples/MatthewM66.wav -synType text -dialogueText "The turbo-encabulator has now reached a high level of development, and it's being successfully used in the operation of novertrunnions." -out cmdExampleText.wav -useExistingEmbed y

 Loaded encoder "english_encoder.pt" trained to step 1564501
Synthesizer using device: cuda
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at CogNativemodelsRTVCsaved_modelsdefaultvocoder.pt
Synthesizing...
Clone output to cmdExampleText.wav

Générer la voix clonée à partir d'un exemple de fichier d'entrée vocale et audio: python -m CogNative.main -sampleAudio CogNativeexamplesMatthewM66.wav -synType audio -dialogueAudio CogNativeexamplesBillMaher22.wav -out cmdExampleAudio.wav -useExistingEmbed n

 Loaded encoder "english_encoder.pt" trained to step 1564501
Synthesizer using device: cuda
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at CogNativemodelsRTVCsaved_modelsdefaultvocoder.pt
Loading requested file...
Synthesizing...
Clone output to cmdExampleAudio.wav

Scripts automatiquement

Ce script traduira l'audio d'une langue prise en charge vers l'anglais. Pour utiliser le script Autotranslate sur Windows, faites glisser et déposez un fichier audio sur le script ou placez un raccourci vers le script dans %AppData%MicrosoftWindowsSendTo et utilisez la fonction "Send to" Menu context sur un fichier audio à traduire. Dans les deux cas, un nouveau fichier .wav avec le nom de fichier original suivi de "_ + Destination Language" sera placé dans le même dossier. Pour d'autres plates-formes, les mêmes indicateurs CLI doivent être utilisés, mais les détails sur l'intégration du menu contextuel varieront selon les packages installés.

Contribuant au projet

Créez votre propre branche git branch yourname-feature-name
Tirez la demande avec une bonne explication de votre branche
Inclure des problèmes que votre demande de traction aborde
Squash et fusion, toujours.

Guide de style Python

Ce guide de style est important pour s'assurer que tout style correspond tout au long du projet. Pour styliser votre code, veuillez utiliser le Styler Black Python.

Fichier unique: black <python-file-name> Tous les fichiers: black .