TTS MultiLingual
1.0.0
pip install TTSSi vous prévoyez de coder ou de former des modèles, cloner TTS et l'installer localement.
git clone https://github.com/saba99/TTS-MultiLingual
pip install -e .[all,dev,notebooks] # Select the relevant extrasSi vous êtes sur Ubuntu (Debian), vous pouvez également exécuter les commandes suivantes pour l'installation.
$ make system-deps # intended to be used on Ubuntu (Debian). Let us know if you have a different OS.
$ make install from TTS . api import TTS
# Running a multi-speaker and multi-lingual model
# List available TTS models and choose the first one
model_name = TTS . list_models ()[ 0 ]
# Init TTS
tts = TTS ( model_name )
# Run TTS
# Since this model is multi-speaker and multi-lingual, we must set the target speaker and the language
# Text to speech with a numpy output
wav = tts . tts ( "This is a test! This is also a test!!" , speaker = tts . speakers [ 0 ], language = tts . languages [ 0 ])
# Text to speech to a file
tts . tts_to_file ( text = "Hello world!" , speaker = tts . speakers [ 0 ], language = tts . languages [ 0 ], file_path = "output.wav" )
# Running a single speaker model
# Init TTS with the target model name
tts = TTS ( model_name = "tts_models/de/thorsten/tacotron2-DDC" , progress_bar = False , gpu = False )
# Run TTS
tts . tts_to_file ( text = "Ich bin eine Testnachricht." , file_path = OUTPUT_PATH )
# Example voice cloning with YourTTS in English, French and Portuguese:
tts = TTS ( model_name = "tts_models/multilingual/multi-dataset/your_tts" , progress_bar = False , gpu = True )
tts . tts_to_file ( "This is voice cloning." , speaker_wav = "my/cloning/audio.wav" , language = "en" , file_path = "output.wav" )
tts . tts_to_file ( "C'est le clonage de la voix." , speaker_wav = "my/cloning/audio.wav" , language = "fr-fr" , file_path = "output.wav" )
tts . tts_to_file ( "Isso é clonagem de voz." , speaker_wav = "my/cloning/audio.wav" , language = "pt-br" , file_path = "output.wav" )
# Example voice conversion converting speaker of the `source_wav` to the speaker of the `target_wav`
tts = TTS ( model_name = "voice_conversion_models/multilingual/vctk/freevc24" , progress_bar = False , gpu = True )
tts . voice_conversion_to_file ( source_wav = "my/source.wav" , target_wav = "my/target.wav" , file_path = "output.wav" )
# Example voice cloning by a single speaker TTS model combining with the voice conversion model. This way, you can
# clone voices by using any model in TTS.
tts = TTS ( "tts_models/de/thorsten/tacotron2-DDC" )
tts . tts_with_vc_to_file (
"Wie sage ich auf Italienisch, dass ich dich liebe?" ,
speaker_wav = "target/speaker.wav" ,
file_path = "ouptut.wav"
)
# Example text to speech using [Coqui Studio](https://coqui.ai) models. You can use all of your available speakers in the studio.
# [Coqui Studio](https://coqui.ai) API token is required. You can get it from the [account page](https://coqui.ai/account).
# You should set the `COQUI_STUDIO_TOKEN` environment variable to use the API token.
# If you have a valid API token set you will see the studio speakers as separate models in the list.
# The name format is coqui_studio/en/<studio_speaker_name>/coqui_studio
models = TTS (). list_models ()
# Init TTS with the target studio speaker
tts = TTS ( model_name = "coqui_studio/en/Torcull Diarmuid/coqui_studio" , progress_bar = False , gpu = False )
# Run TTS
tts . tts_to_file ( text = "This is a test." , file_path = OUTPUT_PATH )
# Run TTS with emotion and speed control
tts . tts_to_file ( text = "This is a test." , file_path = OUTPUT_PATH , emotion = "Happy" , speed = 1.5 )| Petit exemple | Petit exemple | Petit exemple |
arc-en-ciel.mp4 | windy.mp4 | windy-2.mp4 |
| Rainbow est un phénomène météorologique causé par la réflexion, la réfraction et la dispersion de la lumière | Le conducteur a appris sa leçon. Il ne conduira plus jamais dans le vent | Les gens à l'extérieur se penchent. Le vent rend difficile la marche |
| Exemple long | Exemple long | Exemple long |
An.apple.pie.mp4 | Cat.and.a.dog.mp4 | le.farmer.mp4 |
| L'arbre était plein de pommes rouges. L'agriculteur montait son cheval brun. Il s'arrêta sous l'arbre. Il a tendu la main et a choisi une pomme d'une branche. Il a mordu dans la pomme brute. Il aimait la pomme. Son cheval tourna la tête pour le regarder. L'agriculteur a choisi une autre pomme de l'arbre. Il l'a donné au cheval. Le cheval a mangé la pomme brute. Le cheval a apprécié la pomme. L'agriculteur a mis une douzaine de pommes dans un sac. Il est monté au cheval de retour à la maison. Il a mis le cheval dans la grange. Il entra dans sa maison. Le chat se frottait contre sa jambe. Il a donné au chat un bol de lait chaud. / td> | Le chat noir a sauté sur la chaise. Il regarda le chien blanc. Le chien mâchait sur un os. Le chat a sauté sur le chien. Le chien a continué à mâcher l'os. Le chat a joué avec la queue du chien. Le chien a continué à mâcher l'os. Le chat a sauté sur la chaise. Il a commencé à lécher ses pattes. Le chien se leva. Il a regardé le chat. Il a léché la fourrure du chat. Le chat a léché le nez du chien. Le chien est retourné à son os. Un garçon a couru dans la pièce. Il portait une chemise jaune. Il a presque couru sur la chaise. Le chat a sauté de la chaise. Le chat a sauté sur le canapé. | L'agriculteur conduit un tracteur. Le tracteur déterre le sol. Il plante du maïs jaune dans le sol. Il plante le maïs jaune au printemps. Le maïs pousse en été. La pluie aide le maïs à pousser. S'il n'y a pas de pluie, le maïs décède. S'il y a beaucoup de pluie, il y a beaucoup de maïs. Il récolte le maïs jaune à la fin de l'été. Il vend le maïs à son support de légumes. Il vend une oreille pour 25 cents. Il vend quatre oreilles pour 1 $. Il vend tout son maïs en seulement un mois. Les voisins aiment son maïs. Le maïs est frais. C'est jaune vif. C'est savoureux. C'est délicieux. Les oiseaux aiment aussi son maïs. Ils ne paient pas pour cela. Ils le mangent pendant que c'est sur le terrain |
| Support multilingue: anglais | Support multilingue: français | Support multilingue: néerlandais |
Rain.and.hail.mp4 | fr-rain.and.hail.mp4 | nl-rain.and.hail.mp4 |
| Les nuages sombres étaient dans le ciel. Le soleil s'est couché. Le temps a eu froid. Le vent a commencé à souffler. Les feuilles ont soufflé les arbres. Le papier a volé dans les airs. Les gens ont boutonné leurs vestes. La pluie a commencé à tomber. Au début, c'était calme. Puis c'est devenu plus fort | Un arcoíris o arco iris es un fenómeno Óptico y meteorológico que cohété | Een Regenboog est Een Gekleurde Cirkelboog die Aan de Hemel Waargenomen Kan Worden als de, Laagstaande |
tts de ligne de commande Liste des modèles fournis:
$ tts --list_models
Obtenez des informations sur le modèle (pour TTS_MODELS et VOCODER_MODELS):
```
$ tts --model_info_by_name tts_models/tr/common-voice/glow-tts
```
```
$ tts --model_info_by_name vocoder_models/en/ljspeech/hifigan_v2
```
Exécutez TTS avec les modèles par défaut:
Par exemple:
$ tts --text "Text for TTS" --model_name "tts_models/en/ljspeech/glow-tts" --out_path output/path/speech.wav
Exécutez votre propre modèle TTS multi-haut-parleurs:
$ tts --text "Text for TTS" --out_path output/path/speech.wav --model_path path/to/model.pth --config_path path/to/config.json --speakers_file_path path/to/speaker.json --speaker_idx <speaker_id>
|- notebooks/ (Jupyter Notebooks for model evaluation, parameter selection and data analysis.)
|- utils/ (common utilities.)
|- TTS
|- bin/ (folder for all the executables.)
|- train*.py (train your target model.)
|- ...
|- tts/ (text to speech models)
|- layers/ (model layer definitions)
|- models/ (model definitions)
|- utils/ (model specific utilities.)
|- speaker_encoder/ (Speaker Encoder models.)
|- (same)
|- vocoder/ (Vocoder models.)
|- (same)