ReadMe tersedia dalam bahasa berikut:
Silero TTS adalah perpustakaan Python yang menyediakan cara mudah untuk mensintesis pidato dari teks menggunakan berbagai model, bahasa, dan speaker Silero TTS. Ini dapat digunakan sebagai skrip mandiri atau terintegrasi ke dalam proyek Python Anda sendiri.
pip install silero-tts
Klon Repositori:
git clone https://github.com/daswer123/silero-tts-enhanced
Instal dependensi yang diperlukan:
pip install -r requirements.txt
Anda dapat menggunakan Silero TTS sebagai skrip mandiri untuk mensintesis pidato dari file teks atau direktori yang berisi file teks.
python -m silero_tts [options]
--list-models : Daftar model yang tersedia--list-speakers : daftar speaker yang tersedia untuk model--language LANGUAGE : Tentukan kode bahasa (diperlukan)--model MODEL : Tentukan ID Model (Default: Versi Terbaru untuk Bahasa)--speaker SPEAKER : tentukan nama speaker (default: speaker pertama yang tersedia untuk model)--sample-rate SAMPLE_RATE : Tentukan laju sampel (default: 48000)--device DEVICE : Tentukan perangkat untuk digunakan (default: CPU)--text TEXT : Tentukan teks yang akan disintesis--input-file INPUT_FILE : Tentukan file teks input untuk disintesis--input-dir INPUT_DIR : Tentukan direktori input dengan file teks untuk disintesis--output-file OUTPUT_FILE : Tentukan file audio output (default: output.wav)--output-dir OUTPUT_DIR : Tentukan direktori output untuk file audio yang disintesis (default: output)--log-level INFO : Tentukan level log, Anda dapat mematikan nilai penggunaan (default: info) Mensintesis pidato dari sebuah teks:
python silero_tts.py --language ru --text "Привет, мир!"
Sintesis pidato dari file teks:
python silero_tts.py --language en --input-file input.txt --output-file output.wav
Sintesis pidato dari beberapa file teks dalam direktori:
python silero_tts.py --language es --input-dir texts --output-dir audio
Anda juga dapat mengintegrasikan Silero TTS ke dalam proyek Python Anda sendiri dengan mengimpor kelas SileroTTS dan menggunakan metodenya.
from silero_tts . silero_tts import SileroTTS
# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )
# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )
# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )
# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )
# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )
# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )
# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')
# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )
# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )
# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )Silero TTS CLI menyediakan fitur -fitur berikut:
--language untuk mensintesis pidato dalam bahasa yang diinginkan.--model atau biarkan CLI secara otomatis memilih model terbaru untuk bahasa yang ditentukan.--speaker atau gunakan speaker default untuk model yang dipilih.--sample-rate .--device .--text atau tentukan file teks input menggunakan flag --input-file .--input-dir .--output-file atau direktori output untuk pemrosesan batch menggunakan flag --output-dir .--list-models .--list-speakers . Proyek ini dilisensikan di bawah lisensi MIT.