silero tts enhanced
0.0.5
readme은 다음 언어로 제공됩니다.
Silero TTS는 다양한 Silero TTS 모델, 언어 및 스피커를 사용하여 텍스트에서 음성을 쉽게 합성 할 수있는 파이썬 라이브러리입니다. 독립형 스크립트로 사용하거나 자신의 파이썬 프로젝트에 통합 될 수 있습니다.
pip install silero-tts
저장소 복제 :
git clone https://github.com/daswer123/silero-tts-enhanced
필요한 종속성 설치 :
pip install -r requirements.txt
Silero TTS를 독립형 스크립트로 사용하여 텍스트 파일 또는 텍스트 파일이 포함 된 디렉토리의 음성을 종합 할 수 있습니다.
python -m silero_tts [options]
--list-models : 사용 가능한 모델을 나열합니다--list-speakers : 모델에 사용 가능한 스피커를 나열하십시오--language LANGUAGE : 언어 코드 지정 (필수)--model MODEL : 모델 ID 지정 (기본값 : 언어의 최신 버전)--speaker SPEAKER : 스피커 이름을 지정합니다 (기본값 : 모델에 대한 첫 번째 스피커)--sample-rate SAMPLE_RATE : 샘플 속도를 지정합니다 (기본값 : 48000)--device DEVICE : 사용할 장치를 지정합니다 (기본값 : CPU)--text TEXT : 합성 할 텍스트를 지정하십시오--input-file INPUT_FILE : 합성 할 입력 텍스트 파일을 지정합니다.--input-dir INPUT_DIR : 합성 할 텍스트 파일이있는 입력 디렉토리를 지정하십시오.--output-file OUTPUT_FILE : 출력 오디오 파일을 지정합니다 (기본값 : output.wav)--output-dir OUTPUT_DIR : 합성 오디오 파일의 출력 디렉토리를 지정 (기본값 : 출력)--log-level INFO : 로그 레벨을 지정하면 사용하지 않음 값 (기본값 : info) 텍스트에서 연설을 종합합니다.
python silero_tts.py --language ru --text "Привет, мир!"
텍스트 파일에서 음성 합성 :
python silero_tts.py --language en --input-file input.txt --output-file output.wav
디렉토리의 여러 텍스트 파일에서 음성을 종합합니다.
python silero_tts.py --language es --input-dir texts --output-dir audio
SileroTTS 클래스를 가져 와서 그 방법을 사용하여 Silero TTS를 자신의 Python 프로젝트에 통합 할 수도 있습니다.
from silero_tts . silero_tts import SileroTTS
# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )
# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )
# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )
# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )
# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )
# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )
# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')
# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )
# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )
# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )Silero TTS CLI는 다음과 같은 기능을 제공합니다.
--language 언어 플래그를 사용하여 언어 코드를 지정하여 원하는 언어로 음성을 합성하십시오.--model 플래그를 사용하여 특정 모델을 선택하거나 CLI가 지정된 언어의 최신 모델을 자동으로 선택하도록합니다.--speaker 플래그를 사용하여 스피커를 선택하거나 선택한 모델에 기본 스피커를 사용하십시오.--sample-rate 플래그를 사용하여 합성 된 음성의 샘플 속도를 사용자 정의하십시오.--device 디바이스 플래그를 사용하여 합성에 사용할 장치 (CPU 또는 GPU)를 지정하십시오.--text 플래그를 사용하여 직접 합성 할 텍스트를 제공하거나 --input-file 플래그를 사용하여 입력 텍스트 파일을 지정하십시오.--input-dir 플래그를 사용하여 디렉토리에서 여러 텍스트 파일을 처리합니다.--output-file 플래그 또는 --output-dir 플래그를 사용하여 배치 처리를위한 출력 디렉토리를 사용하여 출력 오디오 파일을 지정하십시오.--list-models 플래그를 사용하여 사용 가능한 모든 모델을 나열하십시오.--list-speakers 플래그를 사용하여 특정 모델에 사용 가능한 모든 스피커를 나열하십시오. 이 프로젝트는 MIT 라이센스에 따라 라이센스가 부여됩니다.