ดาวน์โหลด mandarin tts - ดาวน์โหลดซอร์สโค้ด mandarin tts

mandarin tts

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

ข้อความภาษาจีนกลางจีนถึงการพูด (MTTS)

นี่คือกรอบการทำงานแบบข้อความเป็นคำพูดแบบแยกส่วนโดยมีวัตถุประสงค์เพื่อสนับสนุนการวิจัยและการพัฒนาผลิตภัณฑ์อย่างรวดเร็ว คุณสมบัติหลักรวมถึง

โมดูลทั้งหมดสามารถกำหนดค่าได้ผ่าน YAML
การฝังตัวของลำโพง / การฝังตัวของฉันเอง / การฝังข้อความหลายสตรีมได้รับการสนับสนุนและกำหนดค่าได้
นักร้องหลายคน (Vocgan, Hifi-Gan, Waveglow, Melgan) ได้รับการสนับสนุนโดยอะแดปเตอร์เพื่อให้การเปรียบเทียบกับนักร้องที่แตกต่างกันสามารถทำได้อย่างง่ายดาย
รองรับการพยากรณ์ความแปรปรวนระยะเวลา/พิทช์/พลังงานได้รับการสนับสนุนและสามารถเพิ่มความแปรปรวนอื่น ๆ ได้อย่างง่ายดาย
และอีกมากมายเกี่ยวกับแผนที่ถนน

ยินดีต้อนรับการมีส่วนร่วม

ตัวอย่างเสียง

ชำระเงินการสาธิตที่นี่ เช่น

ตัวอย่างเสียงที่น่าสนใจสำหรับ Aishell3 เพิ่มที่นี่
หน้า GitHub ยังโฮสต์ตัวอย่างสำหรับชุดข้อมูล Biaobei และ Aishell3

เริ่มต้นอย่างรวดเร็ว

ติดตั้ง

 git clone https://github.com/ranchlai/mandarin-tts.git
cd mandarin-tts
git submodule update --force --recursive --init --remote
pip install -e . f

การฝึกอบรม

มีตัวอย่างสองตัวอย่างที่นี่: Biaobei และ Aishell3

ในการฝึกอบรมโมเดลของคุณเองให้ทำสำเนาจากตัวอย่างที่มีอยู่ก่อนจากนั้นเตรียมคุณสมบัติ melspectrogram โดยใช้ wav2mel.py โดย

 cd examples
python wav2mel.py -c ./aishell3/config.yaml -w < aishell3_wav_folder > -m < mel_folder > -d cpu

เตรียมไฟล์ SCP ที่จำเป็นสำหรับการฝึกอบรม

 cd examples/aishell3
python prepare.py --wav_folder < aishell3_wav_folder >  --mel_folder < mel_folder > --dst_folder ./train/

สิ่งนี้จะสร้างไฟล์ SCP ที่กำหนดโดย config.yaml (ในส่วนชุดข้อมูล/รถไฟ) คุณจะต้องตรวจสอบว่าทุกอย่างเรียบร้อยดีในไฟล์กำหนดค่า โดยปกติคุณไม่จำเป็นต้องเปลี่ยนรหัส

ตอนนี้คุณสามารถเริ่มการฝึกอบรมได้โดย

 cd examples/aishell3
python ../../mtts/train.py -c config.yaml -d cuda

สำหรับชุดข้อมูล Biaobei เวิร์กโฟลว์เหมือนกันยกเว้นว่าไม่มีลำโพงฝัง แต่คุณสามารถเพิ่มการฝังฉันทลักษณ์ได้

จะเพิ่มตัวอย่างเพิ่มเติม กรุณาอยู่

สังเคราะห์

จุดตรวจ MTTS ที่ผ่านการรับรอง

ปัจจุบันมีสองตัวอย่างและมีการสรุปจุดตรวจสอบ/การกำหนดค่าที่สอดคล้องกันดังนี้

ชุดข้อมูล	ด่าน	การกำหนดค่า
aishell3	การเชื่อมโยง	การเชื่อมโยง
biaobei	การเชื่อมโยง	การเชื่อมโยง

นักร้องที่ได้รับการสนับสนุน

Vocoders มีบทบาทในการแปลง Melspectrograms เป็นรูปคลื่น พวกเขาจะถูกเพิ่มเป็น submodules และจะได้รับการฝึกอบรมในโครงการนี้ ดังนั้นคุณควรดาวน์โหลดจุดตรวจก่อนสังเคราะห์ ในการฝึกอบรมผู้ร้องไม่จำเป็นเนื่องจากคุณสามารถตรวจสอบกระบวนการฝึกอบรมจาก melspectrograms ที่สร้างขึ้นและเส้นโค้งการสูญเสีย ปัจจุบันเราสนับสนุนนักร้องต่อไปนี้

ผู้ร้อง	ด่าน	คนอื่น ๆ
เครื่องเป่านก	การเชื่อมโยง	การเชื่อมโยง
hifi-gan	การเชื่อมโยง	การเชื่อมโยง
vocgan	ลิงค์ลิงค์	การเชื่อมโยง
Melgan	การเชื่อมโยง	การเชื่อมโยง

นักร้องทุกคนจะพร้อมหลังจากเรียกใช้ git submodule update --force --recursive --init --remote อย่างไรก็ตามคุณต้องดาวน์โหลดจุดตรวจสอบด้วยตนเองและตั้งค่าเส้นทางในไฟล์ config.yaml

การเตรียมข้อความอินพุตของคุณ

input.txt ควรสอดคล้องกับการตั้งค่า emb_type1 เป็น emb_type_n ในไฟล์ config เช่นประเภทเดียวกันลำดับเดียวกัน

เพื่ออำนวยความสะดวกในการถอดความ Hanzi เป็น Pinyin คุณสามารถลอง:

 cd examples/aishell3/
python ../../mtts/text/gp2py.py -t "为适应新的网络传播方式和读者阅读习惯"
>> sil wei4 shi4 ying4 xin1 de5 wang3 luo4 chuan2 bo1 fang1 shi4 he2 du2 zhe3 yue4 du2 xi2 guan4 sil|sil 为 适 应 新 的 网 络 传 播 方 式 和 读 者 阅 读 习 惯 sil

ไม่ใช่คุณสามารถคัดลอกข้อความไปที่ input.txt และอย่าลืมใส่ชื่อและรหัสลำโพงที่กำหนดด้วยตนเองโดยคั่นด้วย '|'

สังเคราะห์คลื่นของคุณ

ด้วยจุดตรวจสอบข้างต้นและข้อความพร้อมในที่สุดคุณสามารถเรียกใช้กระบวนการสังเคราะห์ได้

python ../../mtts/synthesize.py  -d cuda --c config.yaml --checkpoint ./checkpoints/checkpoint_1240000.pth.tar -i input.txt

โปรดตรวจสอบไฟล์ config.yaml สำหรับการตั้งค่า Vocoder

หากโชคดีตัวอย่างเสียงสามารถพบได้ในโฟลเดอร์เอาท์พุท

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-08-21
ขนาด 50.36MB
มาจาก Github

แอปที่เกี่ยวข้อง

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด

mandarin tts

ข้อความภาษาจีนกลางจีนถึงการพูด (MTTS)

ตัวอย่างเสียง

เริ่มต้นอย่างรวดเร็ว

ติดตั้ง

การฝึกอบรม

สังเคราะห์

จุดตรวจ MTTS ที่ผ่านการรับรอง

นักร้องที่ได้รับการสนับสนุน

การเตรียมข้อความอินพุตของคุณ

สังเคราะห์คลื่นของคุณ

GitHub sgrebnov/cordova plugin background download

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

F5 TTS ComfyUI

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

ข้อมูลภาษาอังกฤษเกี่ยวกับการพัฒนาเสียง (คู่มือผู้ใช้ TTS เวอร์ชัน Delphi)

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express