TTS MultiLingual
1.0.0
pip install TTSWenn Sie vorhaben, Modelle zu codieren oder zu trainieren, klonen Sie TTs und installieren Sie es lokal.
git clone https://github.com/saba99/TTS-MultiLingual
pip install -e .[all,dev,notebooks] # Select the relevant extrasWenn Sie auf Ubuntu (Debian) sind, können Sie auch die folgenden Befehle zur Installation ausführen.
$ make system-deps # intended to be used on Ubuntu (Debian). Let us know if you have a different OS.
$ make install from TTS . api import TTS
# Running a multi-speaker and multi-lingual model
# List available TTS models and choose the first one
model_name = TTS . list_models ()[ 0 ]
# Init TTS
tts = TTS ( model_name )
# Run TTS
# Since this model is multi-speaker and multi-lingual, we must set the target speaker and the language
# Text to speech with a numpy output
wav = tts . tts ( "This is a test! This is also a test!!" , speaker = tts . speakers [ 0 ], language = tts . languages [ 0 ])
# Text to speech to a file
tts . tts_to_file ( text = "Hello world!" , speaker = tts . speakers [ 0 ], language = tts . languages [ 0 ], file_path = "output.wav" )
# Running a single speaker model
# Init TTS with the target model name
tts = TTS ( model_name = "tts_models/de/thorsten/tacotron2-DDC" , progress_bar = False , gpu = False )
# Run TTS
tts . tts_to_file ( text = "Ich bin eine Testnachricht." , file_path = OUTPUT_PATH )
# Example voice cloning with YourTTS in English, French and Portuguese:
tts = TTS ( model_name = "tts_models/multilingual/multi-dataset/your_tts" , progress_bar = False , gpu = True )
tts . tts_to_file ( "This is voice cloning." , speaker_wav = "my/cloning/audio.wav" , language = "en" , file_path = "output.wav" )
tts . tts_to_file ( "C'est le clonage de la voix." , speaker_wav = "my/cloning/audio.wav" , language = "fr-fr" , file_path = "output.wav" )
tts . tts_to_file ( "Isso é clonagem de voz." , speaker_wav = "my/cloning/audio.wav" , language = "pt-br" , file_path = "output.wav" )
# Example voice conversion converting speaker of the `source_wav` to the speaker of the `target_wav`
tts = TTS ( model_name = "voice_conversion_models/multilingual/vctk/freevc24" , progress_bar = False , gpu = True )
tts . voice_conversion_to_file ( source_wav = "my/source.wav" , target_wav = "my/target.wav" , file_path = "output.wav" )
# Example voice cloning by a single speaker TTS model combining with the voice conversion model. This way, you can
# clone voices by using any model in TTS.
tts = TTS ( "tts_models/de/thorsten/tacotron2-DDC" )
tts . tts_with_vc_to_file (
"Wie sage ich auf Italienisch, dass ich dich liebe?" ,
speaker_wav = "target/speaker.wav" ,
file_path = "ouptut.wav"
)
# Example text to speech using [Coqui Studio](https://coqui.ai) models. You can use all of your available speakers in the studio.
# [Coqui Studio](https://coqui.ai) API token is required. You can get it from the [account page](https://coqui.ai/account).
# You should set the `COQUI_STUDIO_TOKEN` environment variable to use the API token.
# If you have a valid API token set you will see the studio speakers as separate models in the list.
# The name format is coqui_studio/en/<studio_speaker_name>/coqui_studio
models = TTS (). list_models ()
# Init TTS with the target studio speaker
tts = TTS ( model_name = "coqui_studio/en/Torcull Diarmuid/coqui_studio" , progress_bar = False , gpu = False )
# Run TTS
tts . tts_to_file ( text = "This is a test." , file_path = OUTPUT_PATH )
# Run TTS with emotion and speed control
tts . tts_to_file ( text = "This is a test." , file_path = OUTPUT_PATH , emotion = "Happy" , speed = 1.5 )| Kurzes Beispiel | Kurzes Beispiel | Kurzes Beispiel |
Rainbow.mp4 | windy.mp4 | windy-2.mp4 |
| Regenbogen ist ein meteorologisches Phänomen, das durch Reflexion, Brechung und Dispersion des Lichts verursacht wird | Der Fahrer lernte seine Lektion. Er wird nie wieder im Wind fahren | Die Menschen draußen biegen sich über. Der Wind macht es schwer zu laufen |
| Langes Beispiel | Langes Beispiel | Langes Beispiel |
An.apple.pie.mp4 | Cat.and.a.dog.mp4 | Die.farmer.mp4 |
| Der Baum war voll von roten Äpfeln. Der Bauer fuhr mit seinem braunen Pferd. Er blieb unter dem Baum stehen. Er streckte die Hand aus und suchte einen Apfel von einer Filiale. Er biss in den rohen Apfel. Er genoss den Apfel. Sein Pferd drehte seinen Kopf, um ihn anzusehen. Der Landwirt wählte einen weiteren Apfel vom Baum. Er gab es dem Pferd. Das Pferd aß den rohen Apfel. Das Pferd genoss den Apfel. Der Bauer steckte ein Dutzend Äpfel in eine Tasche. Er ritt mit dem Pferd nach Hause. Er steckte das Pferd in die Scheune. Er ging in sein Haus. Die Katze rieb sich an seinem Bein. Er gab der Katze eine Schüssel warme Milch. /td> | Die schwarze Katze sprang auf den Stuhl. Es sah auf den weißen Hund hinunter. Der Hund kaute auf einem Knochen. Die Katze sprang auf den Hund. Der Hund kaute immer wieder den Knochen. Die Katze spielte mit dem Schwanz des Hundes. Der Hund kaute immer wieder den Knochen. Die Katze sprang zurück auf den Stuhl. Es begann seine Pfoten zu lecken. Der Hund stand auf. Es sah die Katze an. Es leckte das Fell der Katze. Die Katze leckte die Nase des Hundes. Der Hund ging zurück in seinen Knochen. Ein Junge rannte durch den Raum. Er trug ein gelbes Hemd. Er rannte fast auf den Stuhl. Die Katze sprang vom Stuhl. Die Katze sprang auf das Sofa. | Der Bauer fährt einen Traktor. Der Traktor gräbt den Boden auf. Er pflanzt gelben Mais in den Boden. Er pflanzt den gelben Mais im Frühjahr. Der Mais wächst im Sommer. Der Regen hilft dem Mais wächst. Wenn es keinen Regen gibt, stirbt der Mais. Wenn es viel Regen gibt, gibt es viel Mais. Er erntet den gelben Mais im Spätsommer. Er verkauft den Mais auf seinem Gemüsestand. Er verkauft ein Ohr für 25 Cent. Er verkauft vier Ohren für 1 Dollar. Er verkauft seinen ganzen Mais in nur einem Monat. Die Nachbarn lieben seinen Mais. Der Mais ist frisch. Es ist hellgelb. Es ist lecker. Es ist köstlich. Die Vögel lieben auch seinen Mais. Sie bezahlen nicht dafür. Sie essen es, während es auf dem Feld ist |
| Mehrsprachige Unterstützung: Englisch | Mehrsprachige Unterstützung: Französisch | Mehrsprachige Unterstützung: Niederländisch |
Rain.and.hail.mp4 | fr-rain.and.hail.mp4 | nl-rain.and.hail.mp4 |
| Dunkle Wolken waren am Himmel. Die Sonne ging runter. Das Wetter wurde kalt. Der Wind begann zu blasen. Die Blätter wehten die Bäume ab. Papier flog durch die Luft. Die Leute haben ihre Jacken geknöpft. Der Regen begann zu fallen. Zuerst war es ruhig. Dann wurde es lauter | Unarcoíris o arco iris es un fenómeno óptico y meteorológico que bestehen en la aparición en el cielo de un arco de Luz Multikolor | Een Regenboog ist Een Gekleurde Cirkelboog Die Aan de Hemel Waargenomen Kan Worden als de, Laagstaande |
tts Liste bereitgestellt Modelle:
$ tts --list_models
Holen Sie sich Modellinformationen (für TTS_Models und Vocoder_Models):
```
$ tts --model_info_by_name tts_models/tr/common-voice/glow-tts
```
```
$ tts --model_info_by_name vocoder_models/en/ljspeech/hifigan_v2
```
Führen Sie TTs mit Standardmodellen aus:
Zum Beispiel:
$ tts --text "Text for TTS" --model_name "tts_models/en/ljspeech/glow-tts" --out_path output/path/speech.wav
Führen Sie Ihr eigenes TTS-Modell mit mehreren Sprechern aus:
$ tts --text "Text for TTS" --out_path output/path/speech.wav --model_path path/to/model.pth --config_path path/to/config.json --speakers_file_path path/to/speaker.json --speaker_idx <speaker_id>
|- notebooks/ (Jupyter Notebooks for model evaluation, parameter selection and data analysis.)
|- utils/ (common utilities.)
|- TTS
|- bin/ (folder for all the executables.)
|- train*.py (train your target model.)
|- ...
|- tts/ (text to speech models)
|- layers/ (model layer definitions)
|- models/ (model definitions)
|- utils/ (model specific utilities.)
|- speaker_encoder/ (Speaker Encoder models.)
|- (same)
|- vocoder/ (Vocoder models.)
|- (same)