silero tts enhanced 다운로드 -Silero silero tts enhanced 소스 코드 다운로드

silero tts enhanced

AI 소스 코드

0.0.5

다운로드

실로 TTS

readme은 다음 언어로 제공됩니다.

Silero TTS는 다양한 Silero TTS 모델, 언어 및 스피커를 사용하여 텍스트에서 음성을 쉽게 합성 할 수있는 파이썬 라이브러리입니다. 독립형 스크립트로 사용하거나 자신의 파이썬 프로젝트에 통합 될 수 있습니다.

특징

여러 언어 및 모델에 대한 지원
최신 모델 구성 파일의 자동 다운로드
텍스트 전처리 및 음역
텍스트 파일의 배치 처리
Loguru와의 자세한 로깅
TQDM으로 진행 상황 추적
샘플 속도, 장치 등을위한 사용자 정의 가능한 옵션
독립형 스크립트로 사용하거나 Python 코드에 통합 될 수 있습니다.

설치

자동 (추천)

 pip install silero-tts

수동

저장소 복제 :

 git clone https://github.com/daswer123/silero-tts-enhanced

필요한 종속성 설치 :
```
 pip install -r requirements.txt
```

용법

독립형 스크립트로

Silero TTS를 독립형 스크립트로 사용하여 텍스트 파일 또는 텍스트 파일이 포함 된 디렉토리의 음성을 종합 할 수 있습니다.

 python -m silero_tts [options]

옵션

--list-models : 사용 가능한 모델을 나열합니다
--list-speakers : 모델에 사용 가능한 스피커를 나열하십시오
--language LANGUAGE : 언어 코드 지정 (필수)
--model MODEL : 모델 ID 지정 (기본값 : 언어의 최신 버전)
--speaker SPEAKER : 스피커 이름을 지정합니다 (기본값 : 모델에 대한 첫 번째 스피커)
--sample-rate SAMPLE_RATE : 샘플 속도를 지정합니다 (기본값 : 48000)
--device DEVICE : 사용할 장치를 지정합니다 (기본값 : CPU)
--text TEXT : 합성 할 텍스트를 지정하십시오
--input-file INPUT_FILE : 합성 할 입력 텍스트 파일을 지정합니다.
--input-dir INPUT_DIR : 합성 할 텍스트 파일이있는 입력 디렉토리를 지정하십시오.
--output-file OUTPUT_FILE : 출력 오디오 파일을 지정합니다 (기본값 : output.wav)
--output-dir OUTPUT_DIR : 합성 오디오 파일의 출력 디렉토리를 지정 (기본값 : 출력)
--log-level INFO : 로그 레벨을 지정하면 사용하지 않음 값 (기본값 : info)

예

텍스트에서 연설을 종합합니다.

 python silero_tts.py --language ru --text "Привет, мир!"

텍스트 파일에서 음성 합성 :

 python silero_tts.py --language en --input-file input.txt --output-file output.wav

디렉토리의 여러 텍스트 파일에서 음성을 종합합니다.

 python silero_tts.py --language es --input-dir texts --output-dir audio

파이썬 라이브러리로

SileroTTS 클래스를 가져 와서 그 방법을 사용하여 Silero TTS를 자신의 Python 프로젝트에 통합 할 수도 있습니다.

 from silero_tts . silero_tts import SileroTTS

# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )

# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )

# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )

# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )

# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )

# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )

# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')

# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )

# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )

# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )

CLI 기능

Silero TTS CLI는 다음과 같은 기능을 제공합니다.

언어 지원 : --language 언어 플래그를 사용하여 언어 코드를 지정하여 원하는 언어로 음성을 합성하십시오.
모델 선택 : --model 플래그를 사용하여 특정 모델을 선택하거나 CLI가 지정된 언어의 최신 모델을 자동으로 선택하도록합니다.
스피커 선택 : --speaker 플래그를 사용하여 스피커를 선택하거나 선택한 모델에 기본 스피커를 사용하십시오.
샘플 속도 : --sample-rate 플래그를 사용하여 합성 된 음성의 샘플 속도를 사용자 정의하십시오.
장치 : --device 디바이스 플래그를 사용하여 합성에 사용할 장치 (CPU 또는 GPU)를 지정하십시오.
텍스트 입력 : --text 플래그를 사용하여 직접 합성 할 텍스트를 제공하거나 --input-file 플래그를 사용하여 입력 텍스트 파일을 지정하십시오.
배치 처리 : --input-dir 플래그를 사용하여 디렉토리에서 여러 텍스트 파일을 처리합니다.
출력 : --output-file 플래그 또는 --output-dir 플래그를 사용하여 배치 처리를위한 출력 디렉토리를 사용하여 출력 오디오 파일을 지정하십시오.
모델 목록 : --list-models 플래그를 사용하여 사용 가능한 모든 모델을 나열하십시오.
스피커 목록 : --list-speakers 플래그를 사용하여 특정 모델에 사용 가능한 모든 스피커를 나열하십시오.