silero tts enhanced Download - silero tts enhanced Source Code Download

silero tts enhanced

Kode Sumber AI

0.0.5

Unduh

Silero tts

ReadMe tersedia dalam bahasa berikut:

Silero TTS adalah perpustakaan Python yang menyediakan cara mudah untuk mensintesis pidato dari teks menggunakan berbagai model, bahasa, dan speaker Silero TTS. Ini dapat digunakan sebagai skrip mandiri atau terintegrasi ke dalam proyek Python Anda sendiri.

Fitur

Dukungan untuk berbagai bahasa dan model
Mengunduh Otomatis File Konfigurasi Model Terbaru
Teks preprocessing dan transliterasi
Pemrosesan file teks
Pencatatan terperinci dengan Loguru
Pelacakan Kemajuan dengan TQDM
Opsi yang dapat disesuaikan untuk laju sampel, perangkat, dan banyak lagi
Dapat digunakan sebagai skrip mandiri atau diintegrasikan ke dalam kode Python

Instalasi

Auto (direkomendasikan)

 pip install silero-tts

Manual

Klon Repositori:

 git clone https://github.com/daswer123/silero-tts-enhanced

Instal dependensi yang diperlukan:
```
 pip install -r requirements.txt
```

Penggunaan

Sebagai skrip mandiri

Anda dapat menggunakan Silero TTS sebagai skrip mandiri untuk mensintesis pidato dari file teks atau direktori yang berisi file teks.

 python -m silero_tts [options]

Opsi

--list-models : Daftar model yang tersedia
--list-speakers : daftar speaker yang tersedia untuk model
--language LANGUAGE : Tentukan kode bahasa (diperlukan)
--model MODEL : Tentukan ID Model (Default: Versi Terbaru untuk Bahasa)
--speaker SPEAKER : tentukan nama speaker (default: speaker pertama yang tersedia untuk model)
--sample-rate SAMPLE_RATE : Tentukan laju sampel (default: 48000)
--device DEVICE : Tentukan perangkat untuk digunakan (default: CPU)
--text TEXT : Tentukan teks yang akan disintesis
--input-file INPUT_FILE : Tentukan file teks input untuk disintesis
--input-dir INPUT_DIR : Tentukan direktori input dengan file teks untuk disintesis
--output-file OUTPUT_FILE : Tentukan file audio output (default: output.wav)
--output-dir OUTPUT_DIR : Tentukan direktori output untuk file audio yang disintesis (default: output)
--log-level INFO : Tentukan level log, Anda dapat mematikan nilai penggunaan (default: info)

Contoh

Mensintesis pidato dari sebuah teks:

 python silero_tts.py --language ru --text "Привет, мир!"

Sintesis pidato dari file teks:

 python silero_tts.py --language en --input-file input.txt --output-file output.wav

Sintesis pidato dari beberapa file teks dalam direktori:

 python silero_tts.py --language es --input-dir texts --output-dir audio

Sebagai Perpustakaan Python

Anda juga dapat mengintegrasikan Silero TTS ke dalam proyek Python Anda sendiri dengan mengimpor kelas SileroTTS dan menggunakan metodenya.

 from silero_tts . silero_tts import SileroTTS

# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )

# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )

# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )

# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )

# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )

# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )

# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')

# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )

# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )

# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )

Fitur CLI

Silero TTS CLI menyediakan fitur -fitur berikut:

Dukungan Bahasa : Tentukan kode bahasa menggunakan bendera --language untuk mensintesis pidato dalam bahasa yang diinginkan.
Pilihan Model : Pilih model tertentu menggunakan flag --model atau biarkan CLI secara otomatis memilih model terbaru untuk bahasa yang ditentukan.
Pemilihan Speaker : Pilih speaker menggunakan flag --speaker atau gunakan speaker default untuk model yang dipilih.
Laju sampel : Kustomisasi laju sampel dari pidato yang disintesis menggunakan flag --sample-rate .
Perangkat : Tentukan perangkat (CPU atau GPU) untuk digunakan untuk sintesis menggunakan -bendera --device .
Input Teks : Menyediakan teks untuk disintesis secara langsung menggunakan flag --text atau tentukan file teks input menggunakan flag --input-file .
Pemrosesan Batch : Proses beberapa file teks dalam direktori menggunakan flag --input-dir .
Output : Tentukan file audio output menggunakan flag --output-file atau direktori output untuk pemrosesan batch menggunakan flag --output-dir .
Daftar Model : Daftar semua model yang tersedia menggunakan bendera --list-models .
Daftar Speaker : Daftar semua speaker yang tersedia untuk model tertentu menggunakan bendera --list-speakers .