Téléchargement MultiSpeech - Téléchargement du code source MultiSpeech

Télécharger

Multissois

Ceci est une implémentation Pytorch de MultiSseech: texte multi-haut-parleurs à la parole avec transformateur

modèle

Afin de former le modèle sur vos données, suivez les étapes ci-dessous

Préparez vos données et assurez-vous que les données sont formatées dans un format PSV comme ci-dessous sans l'en-tête

 speaker_id,audio_path,text,duration
0|file/to/file.wav|the text in that file|3.2

L'ID du haut-parleur doit être entier et commence à 0

Assurez-vous que les audios sont mono sinon effectuer la conversion appropriée pour remplir cette condition

python -m venv env

 source env/bin/activate

pip install -r requirements.txt

former le modèle

python train.py --train_path train_data.txt --test_path test_data.txt --checkpoint_dir outdir --epoch 100 --batch_size 64

Développer

Informations supplémentaires

Applications connexes

Recommandé pour vous

Actualités connexes Tout