ข้อความภาษากวางตุ้ง/จีนเป็นคำพูดตามการสังเคราะห์พารามิเตอร์เชิงสถิติโดยใช้ Merlin Toolkit
โครงการนี้ได้รับอิทธิพลจาก MTTS
Python: Python3.6
ระบบ: Linux (ทดสอบบน Ubuntu16.04)
sudo apt-get install libatlas3-base
เรียกใช้ bash tools/install_mtts.sh
หรือ ดาวน์โหลดไฟล์ด้วยตัวเอง
เรียกใช้การสาธิต
bash run_demo.sh
python src/mtts.py txtfile wav_directory_path output_directory_path (เส้นทางสัมบูรณ์หรือเส้นทางสัมพัทธ์) จากนั้นคุณจะได้รับฉลาก hts ถ้าคุณมีโมเดลอะคูสติกของ -a your_acoustic_model.zip เองตัวอย่าง txtfile
A_01 这是一段文本
A_02 这是第二段文本
ตัวอย่าง WAV_DIRECTORY (อัตราการสุ่มตัวอย่างควรมากกว่า 16KHz)
A_01.wav
A_02.wav
python src/mandarin_frontend.py txtfile output_directory_path from mandarin_frontend import txt2label
result = txt2label('向香港特别行政区同胞澳门和台湾同胞海外侨胞')
[print(line) for line in result]
ดูซอร์สโค้ดสำหรับข้อมูลเพิ่มเติม แต่ให้ความสนใจกับไฟล์การจัดตำแหน่ง (ไฟล์ SFS) รูปแบบคือ endtime phone_type ไม่ใช่ start_time, phone_type (ซึ่งแตกต่างจากข้อมูลของมหาสมุทรคำพูด)
โครงการนี้ใช้การจัดตำแหน่งที่บังคับใช้มอนทรีออลเพื่อทำการจัดตำแหน่งหากคุณต้องการให้ได้การจัดตำแหน่งที่ดีขึ้นให้ใช้ข้อมูลของคุณเพื่อฝึกอบรมโมเดลการจัดตำแหน่งดู MFA: อัลจินใช้อย่างเดียว
คุณสามารถสร้างฉลาก HTS ได้โดยไม่ต้องทำเครื่องหมายฉันทลักษณ์ เราคิดว่าเซ็กเมนต์คำมีขนาดเล็กกว่าคำฉันทลักษณ์ (ซึ่งปรับในรหัส)