แนะนำ:
ยินดีต้อนรับสู่เข้าร่วม
ข้อความภาษาจีนกลาง/ภาษาจีนเป็นคำพูดตามการสังเคราะห์พารามิเตอร์ทางสถิติโดยใช้ Merlin Toolkit
นี่เป็นเพียงการสาธิตที่ส่วนหน้าของการสังเคราะห์การออกเสียง มันไม่ได้ให้ฟังก์ชั่นการทำให้เป็นปกติและการทำนายจังหวะ ใช้ pypinyin เพื่อแปลงข้อความเป็นพินอินและใช้การพูดติดอ่างเป็นคำนาม ความแม่นยำของทั้งสองนี้ไม่ดีเท่าระดับการค้า
สำหรับโครงการสังเคราะห์เสียงอื่น ๆ พอร์ทัลแบบ end-to-end เป็นทิศทางที่ดีและความเป็นธรรมชาติดีกว่าของเมอร์ลิน
นี่เป็นเพียงการสาธิตของส่วนหน้าแมนดารินซึ่งขาดบางส่วนเช่น "ข้อความปกติ" และ "การทำนายฉันทลักษณ์" และชุดโทรศัพท์ && ชุดคำถามโครงการนี้ใช้ HAV ยังไม่ได้ทดสอบอย่างเต็มที่
เอกสารคร่าวๆ: เอกสารร่างที่เขียนในภาษาจีนกลาง
ไม่มีชุดข้อมูลการสังเคราะห์คำพูดภาษาแมนดารินโอเพ่นซอร์
อัปเดต
ข้อมูลการสังเคราะห์คำพูดภาษาแมนดารินโอเพ่นซอร์
【ดาวน์โหลดข้อมูล】 https://weixinxcxdb.oss-cn-beijing.aliyuncs.com/gwyinpinku/bznsyp.rar 【คำอธิบายข้อมูล】 http://www.data-baker.com/open_source.html
ฟัง https://jackiexiao.github.io/mtts/
Python: Python3.6
ระบบ: Linux (ทดสอบบน Ubuntu16.04)
pip install jieba pypinyin
sudo apt-get install libatlas3-base
เรียกใช้ bash tools/install_mtts.sh
หรือ ดาวน์โหลดไฟล์ด้วยตัวเอง
เรียกใช้การสาธิต
bash run_demo.sh
python src/mtts.py txtfile wav_directory_path output_directory_path (เส้นทางสัมบูรณ์หรือเส้นทางสัมพัทธ์) จากนั้นคุณจะได้รับฉลาก hts ถ้าคุณมีโมเดลอะคูสติกของ -a your_acoustic_model.zip เองตัวอย่าง txtfile
A_01 这是一段文本
A_02 这是第二段文本
ตัวอย่าง WAV_DIRECTORY (อัตราการสุ่มตัวอย่างควรมากกว่า 16KHz)
A_01.wav
A_02.wav
python src/mandarin_frontend.py txtfile output_directory_path from mandarin_frontend import txt2label
result = txt2label('向香港特别行政区同胞澳门和台湾同胞海外侨胞')
[print(line) for line in result]
# with prosody mark and alignment file (sfs file)
# result = txt2label('向#1香港#2特别#1行政区#1同胞#4澳门#2和#1台湾#1同胞#4海外#1侨胞',
sfsfile='example_file/example.sfs')
ดูซอร์สโค้ดสำหรับข้อมูลเพิ่มเติม แต่ให้ความสนใจกับไฟล์การจัดตำแหน่ง (ไฟล์ SFS) รูปแบบคือ endtime phone_type ไม่ใช่ start_time, phone_type (ซึ่งแตกต่างจากข้อมูลของมหาสมุทรคำพูด)
โครงการนี้ใช้การจัดตำแหน่งที่บังคับใช้มอนทรีออลเพื่อทำการจัดตำแหน่งหากคุณต้องการให้ได้การจัดตำแหน่งที่ดีขึ้นให้ใช้ข้อมูลของคุณเพื่อฝึกอบรมโมเดลการจัดตำแหน่งดู MFA: อัลจินใช้อย่างเดียว
misc/thchs30.zip , พจนานุกรมที่เราใช้ mandarin_mtts.lexicon หากคุณใช้ชุดข้อมูลขนาดใหญ่กว่า THCHS30 คุณอาจได้รับการจัดตำแหน่งที่ดีขึ้นคุณสามารถสร้างฉลาก HTS ได้โดยไม่ต้องทำเครื่องหมายฉันทลักษณ์ เราคิดว่าเซ็กเมนต์คำมีขนาดเล็กกว่าคำฉันทลักษณ์ (ซึ่งปรับในรหัส)
"#0", "#1", "#2", "#3" และ "#4" เป็นสัญลักษณ์การติดฉลากฉันทลักษณ์