تنزيل TTS MultiLingual - تنزيل رمز المصدر TTS MultiLingual

TTS MultiLingual

كود الذكاء الاصطناعي

1.0.0

تنزيل

رسالة نصية إلى الكلام (TTS) مع البرنامج المساعد Gradio

تثبيت TTS

pip install TTS

إذا كنت تخطط لترميز أو تدريب النماذج ، واستنساخ TTS وتثبيتها محليًا.

git clone https://github.com/saba99/TTS-MultiLingual
pip install -e .[all,dev,notebooks]  # Select the relevant extras

إذا كنت على Ubuntu (Debian) ، فيمكنك أيضًا تشغيل الأوامر التالية للتثبيت.

$ make system-deps  # intended to be used on Ubuntu (Debian). Let us know if you have a different OS.
$ make install

توليف الكلام من TTS

؟ بيثون API

 from TTS . api import TTS

# Running a multi-speaker and multi-lingual model

# List available TTS models and choose the first one
model_name = TTS . list_models ()[ 0 ]
# Init TTS
tts = TTS ( model_name )
# Run TTS
# Since this model is multi-speaker and multi-lingual, we must set the target speaker and the language
# Text to speech with a numpy output
wav = tts . tts ( "This is a test! This is also a test!!" , speaker = tts . speakers [ 0 ], language = tts . languages [ 0 ])
# Text to speech to a file
tts . tts_to_file ( text = "Hello world!" , speaker = tts . speakers [ 0 ], language = tts . languages [ 0 ], file_path = "output.wav" )

# Running a single speaker model

# Init TTS with the target model name
tts = TTS ( model_name = "tts_models/de/thorsten/tacotron2-DDC" , progress_bar = False , gpu = False )
# Run TTS
tts . tts_to_file ( text = "Ich bin eine Testnachricht." , file_path = OUTPUT_PATH )

# Example voice cloning with YourTTS in English, French and Portuguese:
tts = TTS ( model_name = "tts_models/multilingual/multi-dataset/your_tts" , progress_bar = False , gpu = True )
tts . tts_to_file ( "This is voice cloning." , speaker_wav = "my/cloning/audio.wav" , language = "en" , file_path = "output.wav" )
tts . tts_to_file ( "C'est le clonage de la voix." , speaker_wav = "my/cloning/audio.wav" , language = "fr-fr" , file_path = "output.wav" )
tts . tts_to_file ( "Isso é clonagem de voz." , speaker_wav = "my/cloning/audio.wav" , language = "pt-br" , file_path = "output.wav" )


# Example voice conversion converting speaker of the `source_wav` to the speaker of the `target_wav`

tts = TTS ( model_name = "voice_conversion_models/multilingual/vctk/freevc24" , progress_bar = False , gpu = True )
tts . voice_conversion_to_file ( source_wav = "my/source.wav" , target_wav = "my/target.wav" , file_path = "output.wav" )

# Example voice cloning by a single speaker TTS model combining with the voice conversion model. This way, you can
# clone voices by using any model in TTS.

tts = TTS ( "tts_models/de/thorsten/tacotron2-DDC" )
tts . tts_with_vc_to_file (
    "Wie sage ich auf Italienisch, dass ich dich liebe?" ,
    speaker_wav = "target/speaker.wav" ,
    file_path = "ouptut.wav"
)

# Example text to speech using [Coqui Studio](https://coqui.ai) models. You can use all of your available speakers in the studio.
# [Coqui Studio](https://coqui.ai) API token is required. You can get it from the [account page](https://coqui.ai/account).
# You should set the `COQUI_STUDIO_TOKEN` environment variable to use the API token.

# If you have a valid API token set you will see the studio speakers as separate models in the list.
# The name format is coqui_studio/en/<studio_speaker_name>/coqui_studio
models = TTS (). list_models ()
# Init TTS with the target studio speaker
tts = TTS ( model_name = "coqui_studio/en/Torcull Diarmuid/coqui_studio" , progress_bar = False , gpu = False )
# Run TTS
tts . tts_to_file ( text = "This is a test." , file_path = OUTPUT_PATH )
# Run TTS with emotion and speed control
tts . tts_to_file ( text = "This is a test." , file_path = OUTPUT_PATH , emotion = "Happy" , speed = 1.5 )

إخراج الصوت

مثال قصير	مثال قصير	مثال قصير
قوس قزح. mp4	Windy.MP4	Windy-2.mp4
قوس قزح هو ظاهرة الأرصاد الجوية التي تسببها الانعكاس والانكسار وتشتت الضوء	تعلم السائق درسه. لن يقود الريح مرة أخرى أبدًا	الناس في الخارج ينحنيون. الريح تجعل من الصعب المشي
مثال طويل	مثال طويل	مثال طويل
an.apple.pie.mp4	CAT.AND.A.DOG.MP4	the.farmer.mp4
كانت الشجرة مليئة بالتفاح الأحمر. كان المزارع يركب حصانه البني. توقف تحت الشجرة. مد يده واختار تفاحة من فرع. انه قليلا في التفاح الخام. لقد استمتع بالتفاح. حول حصانه رأسه للنظر إليه. اختار المزارع تفاحة أخرى من الشجرة. أعطاها للحصان. أكل الحصان التفاح الخام. استمتع الحصان بالتفاح. وضع المزارع عشرات التفاح في حقيبة. ركب الحصان في المنزل. وضع الحصان في الحظيرة. مشى إلى منزله. فرك القطة على ساقه. أعطى القط وعاء من الحليب الدافئ. /td>	قفز القطة السوداء على الكرسي. نظرت لأسفل على الكلب الأبيض. كان الكلب يمضغ على عظم. قفز القطة على الكلب. ظل الكلب مضغ العظم. لعبت القط مع ذيل الكلب. ظل الكلب مضغ العظم. قفز القط مرة أخرى على الكرسي. بدأت لعق الكفوف. وقف الكلب. نظرت إلى القط. لعق فراء القط. القط لعق أنف الكلب. عاد الكلب حتى عظمه. ركض صبي عبر الغرفة. كان يرتدي قميصًا أصفر. كان تقريبا ركض على الكرسي. قفز القط من الكرسي. قفز القط على الأريكة.	المزارع يقود جرار. يحفر الجرار على الأرض. انه يزرع الذرة الصفراء في الأرض. انه يزرع الذرة الصفراء في الربيع. تنمو الذرة في الصيف. المطر يساعد الذرة على النمو. إذا لم يكن هناك المطر ، وفاة الذرة. إذا كان هناك الكثير من الأمطار ، فهناك الكثير من الذرة. انه يحصد الذرة الصفراء في أواخر الصيف. يبيع الذرة في موقفه من الخضار. يبيع أذن واحدة مقابل 25 سنتا. يبيع أربعة أذنين مقابل 1 دولار. يبيع كل ذرةه في شهر واحد فقط. الجيران يحبون ذرةه. الذرة جديدة. إنه أصفر مشرق. إنه لذيذ. إنه لذيذ. الطيور تحب ذرةه أيضًا. إنهم لا يدفعون ثمنها. يأكلونها أثناء وجودها في الحقل
الدعم متعدد اللغات: اللغة الإنجليزية	الدعم متعدد اللغات: الفرنسية	الدعم متعدد اللغات: الهولندية
Rain.and.hail.mp4	fr-rain.and.hail.mp4	nl-rain.and.hail.mp4
كانت الغيوم المظلمة في السماء. سقطت الشمس. أصبح الطقس باردًا. بدأت الريح تهب. تنفجر الأوراق من الأشجار. طار الورق من خلال الهواء. قام الناس بزر السترات. بدأ المطر يسقط. في البداية ، كان هادئًا. ثم أصبحت بصوت أعلى	un arcoíris o arco iris es un fenómeno óptico y meteorológico que cense en la aparición en el cielo de un arco de luz multicolor	een regenboog هو een gekleurde cirkelboog die aan de hemel waargenomen kan worden de ، laagstaande

سطر الأوامر `tts`

نماذج المتحدث الفردية

القائمة النماذج المقدمة:
```
 $ tts --list_models
```

احصل على معلومات النموذج (لكل من TTS_Models و Vocoder_Models):

 ```
 $ tts --model_info_by_name tts_models/tr/common-voice/glow-tts
  ```
  ```
  $ tts --model_info_by_name vocoder_models/en/ljspeech/hifigan_v2
  ```

قم بتشغيل TTS مع النماذج الافتراضية:

على سبيل المثال:

 $ tts --text "Text for TTS" --model_name "tts_models/en/ljspeech/glow-tts" --out_path output/path/speech.wav

نماذج متعددة الكلام

قم بتشغيل طراز TTS الخاص بك المتعدد الكلام:

 $ tts --text "Text for TTS" --out_path output/path/speech.wav --model_path path/to/model.pth --config_path path/to/config.json --speakers_file_path path/to/speaker.json --speaker_idx <speaker_id>

هيكل الدليل

 |- notebooks/       (Jupyter Notebooks for model evaluation, parameter selection and data analysis.)
|- utils/           (common utilities.)
|- TTS
    |- bin/             (folder for all the executables.)
      |- train*.py                  (train your target model.)
      |- ...
    |- tts/             (text to speech models)
        |- layers/          (model layer definitions)
        |- models/          (model definitions)
        |- utils/           (model specific utilities.)
    |- speaker_encoder/ (Speaker Encoder models.)
        |- (same)
    |- vocoder/         (Vocoder models.)
        |- (same)

يوسع

معلومات إضافية