ดาวน์โหลด silero tts api server - ดาวน์โหลดซอร์สโค้ด silero tts api server

ดาวน์โหลด

แบนเนอร์

สนับสนุนภาษา

บันทึก

ทุกรุ่นมาจากที่เก็บ: Snakers4/Silero-Models

ภาษา	แบบอย่าง	ลำโพง
ชาวรัสเซีย	v4_ru	5: Aidar, Baya, Kseniya, Xenia, Eugene
ชาวยูเครน	v4_ua	1: mykyta
อุซเบก	v4_uz	1: Dilnavoz
ภาษาอังกฤษ	v3_en	118: en_0, en_1, ... , en_117
เกี่ยวกับภาษาสเปน	v3_es	3: ES_0, ES_1, ES_2
ภาษาฝรั่งเศส	v3_fr	6: fr_0, fr_1, fr_2, fr_3, fr_4, fr_5
ชาวเยอรมัน	v3_de	5: Bernd_ungerer, Eva_K, Friedrich, Hokuspokus, Karlsson
ตาตาร์	v3_tt	1: Dilyara
ชาวมองโกเลีย	v3_xal	2: Erdni, Delghir

สำคัญ

สิ่งนี้ต้องมีการติดตั้ง Docker และ Docker Daemon กำลังทำงานอยู่

docker run --rm -p 8000:8000 twirapp/silero-tts-api-server

สร้างและเรียกใช้จากที่เก็บในท้องถิ่น

โคลนที่เก็บ:

git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server

สร้างภาพนักเทียบท่า:

docker build -f docker/Dockerfile -t silero-tts-api-server .

เรียกใช้คอนเทนเนอร์:

docker run --rm -p 8000:8000 silero-tts-api-server

หรือใช้ Docker Compose:

docker-compose -f docker/compose.yml up

สำคัญ

ข้อกำหนดขั้นต่ำ Python 3.9

โครงการนี้ใช้ Rye สำหรับการจัดการการพึ่งพาจะถือว่าคุณได้ติดตั้งแล้ว

โคลนที่เก็บ

git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server

บันทึก

ค่าเริ่มต้นจะเป็น localhost: 8000

คุณสามารถดูเอกสารที่สร้างขึ้นโดยอัตโนมัติตาม OpenAPI ได้ที่:

ผู้ให้บริการ	url
พูดพอดี	https: // localhost: 8000/schema/
ใหม่	https: // localhost: 8000/schema/redoc
องค์ประกอบของสต็อปไลท์	https: // localhost: 8000/schema/องค์ประกอบ
repidoc	https: // localhost: 8000/schema/repidoc
openapi schema yaml	https: // localhost: 8000/schema/openapi.yaml
Openapi Schema Json	https: // localhost: 8000/schema/openapi.json

GET /generate - สร้างเสียงในรูปแบบ WAV จากข้อความ พารามิเตอร์: speaker text sample_rate , pitch , rate
GET /speakers - รับรายชื่อลำโพง

sample_rate สามารถตั้งค่าได้จาก 8 000, 24 000, 48 000 pitch และ rate สามารถตั้งค่าได้ตั้งแต่ 0 เป็น 100

TEXT_LENGTH_LIMIT - ความยาวสูงสุดของข้อความที่จะประมวลผล ค่าเริ่มต้นคือ 930 อักขระ
MKL_NUM_THREADS - จำนวนเธรดที่จะใช้สำหรับการสร้างเสียง จำนวนเริ่มต้นของเธรด: จำนวนคอร์ CPU