silero tts enhanced下载silero tts enhanced源代码下载

silero tts enhanced

Ai源码

0.0.5

下载

Silero TTS

以下语言可用readme：

Silero TTS是一个Python库，它提供了一种简单的方法，可以使用各种Silero TTS模型，语言和扬声器从文本中综合语音。它可以用作独立脚本，也可以集成到您自己的Python项目中。

特征

支持多种语言和模型
自动下载最新模型配置文件
文本预处理和音译
文本文件的批处理处理
用loguru进行详细的登录
使用TQDM进行进度跟踪
可自定义的样品率，设备等的选项
可以用作独立脚本或集成到Python代码中

安装

自动（推荐）

 pip install silero-tts

手动

克隆存储库：

 git clone https://github.com/daswer123/silero-tts-enhanced

安装所需的依赖项：
```
 pip install -r requirements.txt
```

用法

作为独立脚本

您可以将Silero TTs用作独立脚本来合成来自包含文本文件的文本文件或目录的语音。

 python -m silero_tts [options]

选项

--list-models ：列表可用模型
--list-speakers ：列表模型的可用扬声器
--language LANGUAGE ：指定语言代码（必需）
--model MODEL ：指定模型ID（默认：语言的最新版本）
--speaker SPEAKER ：指定扬声器名称（默认值：模型的第一个可用扬声器）
--sample-rate SAMPLE_RATE ：指定样本率（默认值：48000）
--device DEVICE ：指定要使用的设备（默认：CPU）
--text TEXT ：指定文本以合成
--input-file INPUT_FILE ：指定输入文本文件以合成
--input-dir INPUT_DIR ：指定带有文本文件的输入目录以合成
--output-file OUTPUT_FILE ：指定输出音频文件（默认：output.wav）
--output-dir OUTPUT_DIR ：指定合成音频文件的输出目录（默认：输出）
--log-level INFO ：指定日志级别，您可以关闭使用无值（默认值：info）

例子

从文本中综合语音：

 python silero_tts.py --language ru --text "Привет, мир!"

从文本文件中综合语音：

 python silero_tts.py --language en --input-file input.txt --output-file output.wav

从目录中的多个文本文件中综合语音：

 python silero_tts.py --language es --input-dir texts --output-dir audio

作为Python图书馆

您还可以通过导入SileroTTS类并使用其方法将Silero TTS集成到您自己的Python项目中。

 from silero_tts . silero_tts import SileroTTS

# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )

# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )

# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )

# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )

# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )

# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )

# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')

# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )

# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )

# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )