تنزيل silero tts enhanced - تنزيل رمز المصدر silero tts enhanced

silero tts enhanced

كود الذكاء الاصطناعي

0.0.5

تنزيل

Silero TTS

README متاح باللغات التالية:

Silero TTS هي مكتبة Python توفر طريقة سهلة لتوليف الكلام من النص باستخدام نماذج Silero TTS المختلفة واللغات والمتحدثين. يمكن استخدامه كنص مستقل أو مدمج في مشاريع بيثون الخاصة بك.

سمات

دعم لغات ونماذج متعددة
التنزيل التلقائي لأحدث ملف تكوين النماذج
نص معالجة وترجمة
معالجة الدُفعات للملفات النصية
تسجيل تفصيلي مع لوجورو
تتبع التقدم مع TQDM
خيارات قابلة للتخصيص لمعدل العينة والجهاز والمزيد
يمكن استخدامه كنص مستقل أو مدمج في رمز الثعبان

تثبيت

السيارات (يوصي)

 pip install silero-tts

دليل

استنساخ المستودع:

 git clone https://github.com/daswer123/silero-tts-enhanced

تثبيت التبعيات المطلوبة:
```
 pip install -r requirements.txt
```

الاستخدام

كنص مستقل

يمكنك استخدام Silero TTS كنصي مستقل لتوليف الكلام من الملفات النصية أو الدلائل التي تحتوي على ملفات نصية.

 python -m silero_tts [options]

خيارات

--list-models : قائمة النماذج المتاحة
--list-speakers : قائمة مكبرات صوت متوفرة لنموذج
--language LANGUAGE : حدد رمز اللغة (مطلوب)
--model MODEL : حدد معرف النموذج (الافتراضي: أحدث إصدار للغة)
--speaker SPEAKER : حدد اسم السماعة (الافتراضي: أول مكبر صوت متاح للنموذج)
--sample-rate SAMPLE_RATE : حدد معدل العينة (الافتراضي: 48000)
--device DEVICE : حدد الجهاز لاستخدامه (افتراضي: وحدة المعالجة المركزية)
--text TEXT : حدد النص لتوليفه
--input-file INPUT_FILE : حدد ملف نص الإدخال لتوليفه
--input-dir INPUT_DIR : حدد دليل الإدخال مع ملفات نصية لتوليفها
--output-file OUTPUT_FILE : حدد ملف صوت الإخراج (الافتراضي: Output.wav)
--output-dir OUTPUT_DIR : حدد دليل الإخراج لملفات الصوت المريحة (الافتراضي: الإخراج)
--log-level INFO : حدد مستوى السجل ، يمكنك إيقاف تشغيل استخدام لا شيء (افتراضي: معلومات)

أمثلة

توليف الكلام من النص:

 python silero_tts.py --language ru --text "Привет, мир!"

توليف الكلام من ملف نصي:

 python silero_tts.py --language en --input-file input.txt --output-file output.wav

توليف الكلام من ملفات نصية متعددة في الدليل:
```
 python silero_tts.py --language es --input-dir texts --output-dir audio
```

كمكتبة بيثون

يمكنك أيضًا دمج Silero TTS في مشاريع Python الخاصة بك عن طريق استيراد فئة SileroTTS واستخدام أساليبها.

 from silero_tts . silero_tts import SileroTTS

# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )

# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )

# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )

# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )

# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )

# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )

# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')

# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )

# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )

# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )

ميزات CLI

يوفر Silero TTS CLI الميزات التالية:

دعم اللغة : حدد رمز اللغة باستخدام علامة --language -لتوليف الكلام باللغة المطلوبة.
اختيار النموذج : اختر نموذجًا محددًا باستخدام علامة --model أو اترك CLI تلقائيًا تحديد أحدث طراز للغة المحددة.
اختيار مكبر الصوت : حدد مكبر صوت باستخدام علامة --speaker أو استخدم السماعة الافتراضية للنموذج المختار.
معدل العينة : تخصيص معدل العينة من الكلام المصنوع باستخدام علامة --sample-rate .
الجهاز : حدد الجهاز (وحدة المعالجة المركزية أو GPU) لاستخدامها في التوليف باستخدام علامة --device .
إدخال النص : قم بتوفير النص لتوليفه مباشرة باستخدام علامة- --text أو تحديد ملف نصي إدخال باستخدام علامة --input-file .
معالجة الدُفعات : معالجة ملفات نصية متعددة في دليل باستخدام علامة --input-dir .
الإخراج : حدد ملف صوت الإخراج باستخدام علامة --output-file أو دليل الإخراج لمعالجة الدُفعات باستخدام علامة --output-dir .
قائمة النماذج : قائمة جميع النماذج المتاحة باستخدام علامة --list-models .
قائمة المتحدثين : قائمة جميع المتحدثين المتاحين لنموذج معين باستخدام علامة --list-speakers .