silero tts api server
1.0.0

메모
모든 모델은 저장소에서 나온 것입니다 : Snakers4/Silero-Models
| 언어 | 모델 | 스피커 |
|---|---|---|
| 러시아인 | V4_RU | 5 : Aidar, Baya, Kseniya, Xenia, Eugene |
| 우크라이나 말 | V4_UA | 1 : Mykyta |
| 우즈벡 | v4_uz | 1 : Dilnavoz |
| 영어 | v3_en | 118 : en_0, en_1, ..., en_117 |
| 스페인 사람 | v3_es | 3 : ES_0, ES_1, ES_2 |
| 프랑스 국민 | v3_fr | 6 : FR_0, FR_1, FR_2, FR_3, FR_4, FR_5 |
| 독일 사람 | v3_de | 5 : Bernd_ungerer, Eva_K, Friedrich, Hokuspokus, Karlsson |
| 타타르 | v3_tt | 1 : Dilyara |
| 몽고 어 | v3_xal | 2 : Erdni, Delghir |
중요한
이를 위해서는 Docker가 설치되고 Docker Deomon이 실행해야합니다
docker run --rm -p 8000:8000 twirapp/silero-tts-api-server저장소 복제 :
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server도커 이미지 빌드 :
docker build -f docker/Dockerfile -t silero-tts-api-server .컨테이너 실행 :
docker run --rm -p 8000:8000 silero-tts-api-server또는 Docker Compose 사용 :
docker-compose -f docker/compose.yml up중요한
최소 요구 사항 파이썬 3.9
이 프로젝트는 의존성 관리를 위해 Rye를 사용합니다. 설치했다고 가정합니다.
저장소를 복제하십시오
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server종속성을 설치하십시오
이것은 .venv 디렉토리에서 가상 환경을 자동으로 생성하고 필요한 종속성을 설치합니다.
rye syncpython3 -m venv .venv && source .venv/bin/activate필요한 종속성 만 설치하십시오.
pip3 install --no-deps -r requirements.lockSilero TTS 모델을 다운로드하십시오
bash ./install_models.sh서버를 실행하십시오
litestar run메모
기본값은 LocalHost : 8000입니다
OpenAPI를 기반으로 자동 생성 된 문서를 볼 수 있습니다.
| 공급자 | URL |
|---|---|
| 멋진 | https : // localhost : 8000/schema/ |
| 리록 | https : // localhost : 8000/schema/recoc |
| 신호등 요소 | https : // localhost : 8000/schema/elements |
| 리피도 | https : // localhost : 8000/schema/refidoc |
| OpenApi 스키마 Yaml | https : // localhost : 8000/schema/openapi.yaml |
| OpenApi 스키마 JSON | https : // localhost : 8000/schema/openapi.json |
GET /generate 텍스트에서 WAV 형식으로 오디오를 생성합니다. 매개 변수 : text speaker sample_rate , pitch , rateGET /speakers 스피커 목록을 가져옵니다 sample_rate 8,000, 24 000, 48,000 pitch 로 설정할 수 있으며 rate 0에서 100까지 설정할 수 있습니다.
TEXT_LENGTH_LIMIT 처리 할 텍스트의 최대 길이. 기본값은 930 자입니다.MKL_NUM_THREADS 오디오 생성에 사용할 스레드 수. 스레드의 기본 수 : CPU 코어 수.이 저장소는 TWIR.App 전용이며 요구 사항을 충족하도록 설계되었습니다.
TWIRAPP는 CPU를 사용하여 오디오를 생성해야합니다. CUDA 또는 MPS와 같은 다른 장치에 대한 지원이 필요한 경우 문제를여십시오.