silero tts enhanced
0.0.5
README متاح باللغات التالية:
Silero TTS هي مكتبة Python توفر طريقة سهلة لتوليف الكلام من النص باستخدام نماذج Silero TTS المختلفة واللغات والمتحدثين. يمكن استخدامه كنص مستقل أو مدمج في مشاريع بيثون الخاصة بك.
pip install silero-tts
استنساخ المستودع:
git clone https://github.com/daswer123/silero-tts-enhanced
تثبيت التبعيات المطلوبة:
pip install -r requirements.txt
يمكنك استخدام Silero TTS كنصي مستقل لتوليف الكلام من الملفات النصية أو الدلائل التي تحتوي على ملفات نصية.
python -m silero_tts [options]
--list-models : قائمة النماذج المتاحة--list-speakers : قائمة مكبرات صوت متوفرة لنموذج--language LANGUAGE : حدد رمز اللغة (مطلوب)--model MODEL : حدد معرف النموذج (الافتراضي: أحدث إصدار للغة)--speaker SPEAKER : حدد اسم السماعة (الافتراضي: أول مكبر صوت متاح للنموذج)--sample-rate SAMPLE_RATE : حدد معدل العينة (الافتراضي: 48000)--device DEVICE : حدد الجهاز لاستخدامه (افتراضي: وحدة المعالجة المركزية)--text TEXT : حدد النص لتوليفه--input-file INPUT_FILE : حدد ملف نص الإدخال لتوليفه--input-dir INPUT_DIR : حدد دليل الإدخال مع ملفات نصية لتوليفها--output-file OUTPUT_FILE : حدد ملف صوت الإخراج (الافتراضي: Output.wav)--output-dir OUTPUT_DIR : حدد دليل الإخراج لملفات الصوت المريحة (الافتراضي: الإخراج)--log-level INFO : حدد مستوى السجل ، يمكنك إيقاف تشغيل استخدام لا شيء (افتراضي: معلومات) توليف الكلام من النص:
python silero_tts.py --language ru --text "Привет, мир!"
توليف الكلام من ملف نصي:
python silero_tts.py --language en --input-file input.txt --output-file output.wav
توليف الكلام من ملفات نصية متعددة في الدليل:
python silero_tts.py --language es --input-dir texts --output-dir audio
يمكنك أيضًا دمج Silero TTS في مشاريع Python الخاصة بك عن طريق استيراد فئة SileroTTS واستخدام أساليبها.
from silero_tts . silero_tts import SileroTTS
# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )
# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )
# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )
# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )
# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )
# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )
# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')
# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )
# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )
# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )يوفر Silero TTS CLI الميزات التالية:
--language -لتوليف الكلام باللغة المطلوبة.--model أو اترك CLI تلقائيًا تحديد أحدث طراز للغة المحددة.--speaker أو استخدم السماعة الافتراضية للنموذج المختار.--sample-rate .--device .--text أو تحديد ملف نصي إدخال باستخدام علامة --input-file .--input-dir .--output-file أو دليل الإخراج لمعالجة الدُفعات باستخدام علامة --output-dir .--list-models .--list-speakers . هذا المشروع مرخص بموجب ترخيص معهد ماساتشوستس للتكنولوجيا.