silero tts enhanced
0.0.5
以下语言可用readme:
Silero TTS是一个Python库,它提供了一种简单的方法,可以使用各种Silero TTS模型,语言和扬声器从文本中综合语音。它可以用作独立脚本,也可以集成到您自己的Python项目中。
pip install silero-tts
克隆存储库:
git clone https://github.com/daswer123/silero-tts-enhanced
安装所需的依赖项:
pip install -r requirements.txt
您可以将Silero TTs用作独立脚本来合成来自包含文本文件的文本文件或目录的语音。
python -m silero_tts [options]
--list-models :列表可用模型--list-speakers :列表模型的可用扬声器--language LANGUAGE :指定语言代码(必需)--model MODEL :指定模型ID(默认:语言的最新版本)--speaker SPEAKER :指定扬声器名称(默认值:模型的第一个可用扬声器)--sample-rate SAMPLE_RATE :指定样本率(默认值:48000)--device DEVICE :指定要使用的设备(默认:CPU)--text TEXT :指定文本以合成--input-file INPUT_FILE :指定输入文本文件以合成--input-dir INPUT_DIR :指定带有文本文件的输入目录以合成--output-file OUTPUT_FILE :指定输出音频文件(默认:output.wav)--output-dir OUTPUT_DIR :指定合成音频文件的输出目录(默认:输出)--log-level INFO :指定日志级别,您可以关闭使用无值(默认值:info) 从文本中综合语音:
python silero_tts.py --language ru --text "Привет, мир!"
从文本文件中综合语音:
python silero_tts.py --language en --input-file input.txt --output-file output.wav
从目录中的多个文本文件中综合语音:
python silero_tts.py --language es --input-dir texts --output-dir audio
您还可以通过导入SileroTTS类并使用其方法将Silero TTS集成到您自己的Python项目中。
from silero_tts . silero_tts import SileroTTS
# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )
# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )
# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )
# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )
# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )
# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )
# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')
# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )
# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )
# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )Silero TTS CLI提供以下功能:
--language标志指定语言代码,以所需的语言合成语音。--model标志选择一个特定的模型,或者让CLI自动为指定语言选择最新模型。--speaker标志选择扬声器或将默认扬声器用于所选模型。--sample-rate标志自定义合成语音的样本率。--device标志的设备(CPU或GPU)用于合成。--text标志直接合成或使用--input-file标志指定输入文本文件。--input-dir标志在目录中处理多个文本文件。--output-file标志或输出目录指定输出音频文件,用于使用--output-dir标志进行批处理处理。--list-models标志列出所有可用模型。--list-speakers标志列出特定型号的所有可用扬声器。 该项目已根据MIT许可获得许可。