silero tts enhanced下載silero tts enhanced源代碼下載

silero tts enhanced

Ai源碼

0.0.5

下載

Silero TTS

以下語言可用readme：

Silero TTS是一個Python庫，它提供了一種簡單的方法，可以使用各種Silero TTS模型，語言和揚聲器從文本中綜合語音。它可以用作獨立腳本，也可以集成到您自己的Python項目中。

特徵

支持多種語言和模型
自動下載最新模型配置文件
文本預處理和音譯
文本文件的批處理處理
用loguru進行詳細的登錄
使用TQDM進行進度跟踪
可自定義的樣品率，設備等的選項
可以用作獨立腳本或集成到Python代碼中

安裝

自動（推薦）

 pip install silero-tts

手動

克隆存儲庫：

 git clone https://github.com/daswer123/silero-tts-enhanced

安裝所需的依賴項：
```
 pip install -r requirements.txt
```

用法

作為獨立腳本

您可以將Silero TTs用作獨立腳本來合成來自包含文本文件的文本文件或目錄的語音。

 python -m silero_tts [options]

選項

--list-models ：列表可用模型
--list-speakers ：列表模型的可用揚聲器
--language LANGUAGE ：指定語言代碼（必需）
--model MODEL ：指定模型ID（默認：語言的最新版本）
--speaker SPEAKER ：指定揚聲器名稱（默認值：模型的第一個可用揚聲器）
--sample-rate SAMPLE_RATE ：指定樣本率（默認值：48000）
--device DEVICE ：指定要使用的設備（默認：CPU）
--text TEXT ：指定文本以合成
--input-file INPUT_FILE ：指定輸入文本文件以合成
--input-dir INPUT_DIR ：指定帶有文本文件的輸入目錄以合成
--output-file OUTPUT_FILE ：指定輸出音頻文件（默認：output.wav）
--output-dir OUTPUT_DIR ：指定合成音頻文件的輸出目錄（默認：輸出）
--log-level INFO ：指定日誌級別，您可以關閉使用無值（默認值：info）

例子

從文本中綜合語音：

 python silero_tts.py --language ru --text "Привет, мир!"

從文本文件中綜合語音：

 python silero_tts.py --language en --input-file input.txt --output-file output.wav

從目錄中的多個文本文件中綜合語音：

 python silero_tts.py --language es --input-dir texts --output-dir audio

作為Python圖書館

您還可以通過導入SileroTTS類並使用其方法將Silero TTS集成到您自己的Python項目中。

 from silero_tts . silero_tts import SileroTTS

# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )

# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )

# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )

# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )

# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )

# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )

# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')

# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )

# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )

# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )