silero tts enhanced
0.0.5
以下語言可用readme:
Silero TTS是一個Python庫,它提供了一種簡單的方法,可以使用各種Silero TTS模型,語言和揚聲器從文本中綜合語音。它可以用作獨立腳本,也可以集成到您自己的Python項目中。
pip install silero-tts
克隆存儲庫:
git clone https://github.com/daswer123/silero-tts-enhanced
安裝所需的依賴項:
pip install -r requirements.txt
您可以將Silero TTs用作獨立腳本來合成來自包含文本文件的文本文件或目錄的語音。
python -m silero_tts [options]
--list-models :列表可用模型--list-speakers :列表模型的可用揚聲器--language LANGUAGE :指定語言代碼(必需)--model MODEL :指定模型ID(默認:語言的最新版本)--speaker SPEAKER :指定揚聲器名稱(默認值:模型的第一個可用揚聲器)--sample-rate SAMPLE_RATE :指定樣本率(默認值:48000)--device DEVICE :指定要使用的設備(默認:CPU)--text TEXT :指定文本以合成--input-file INPUT_FILE :指定輸入文本文件以合成--input-dir INPUT_DIR :指定帶有文本文件的輸入目錄以合成--output-file OUTPUT_FILE :指定輸出音頻文件(默認:output.wav)--output-dir OUTPUT_DIR :指定合成音頻文件的輸出目錄(默認:輸出)--log-level INFO :指定日誌級別,您可以關閉使用無值(默認值:info) 從文本中綜合語音:
python silero_tts.py --language ru --text "Привет, мир!"
從文本文件中綜合語音:
python silero_tts.py --language en --input-file input.txt --output-file output.wav
從目錄中的多個文本文件中綜合語音:
python silero_tts.py --language es --input-dir texts --output-dir audio
您還可以通過導入SileroTTS類並使用其方法將Silero TTS集成到您自己的Python項目中。
from silero_tts . silero_tts import SileroTTS
# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )
# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )
# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )
# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )
# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )
# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )
# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')
# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )
# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )
# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )Silero TTS CLI提供以下功能:
--language標誌指定語言代碼,以所需的語言合成語音。--model標誌選擇一個特定的模型,或者讓CLI自動為指定語言選擇最新模型。--speaker標誌選擇揚聲器或將默認揚聲器用於所選模型。--sample-rate標誌自定義合成語音的樣本率。--device標誌的設備(CPU或GPU)用於合成。--text標誌直接合成或使用--input-file標誌指定輸入文本文件。--input-dir標誌在目錄中處理多個文本文件。--output-file標誌或輸出目錄指定輸出音頻文件,用於使用--output-dir標誌進行批處理處理。--list-models標誌列出所有可用模型。--list-speakers標誌列出特定型號的所有可用揚聲器。 該項目已根據MIT許可獲得許可。