Python Hindi TTS
มันเป็นระบบข้อความต่อคำพูดที่เชื่อมต่อกันใน Python
เราเริ่มโครงการนี้ในเดือนตุลาคม 2564 เป็นโครงการสอน การทำงานภาษาธรรมชาติ
ระบบการพูดแบบข้อความต่อคำพูดที่เชื่อมโยงกันสร้างการแสดงเสียงของข้อความโดยการวางไฟล์เสียงขนาดเล็กจำนวนมากเข้าด้วยกันเพื่อสร้างเอาต์พุตทั้งหมด
มีสามขั้นตอนรวมถึง:
- ข้อความถึงคำ ที่ข้อความอินพุตดิบถูกนำไปใช้ในรายการคำ โดยทั่วไปยังรวมถึงการแปลงตัวเลขตัวเลขเป็นคำที่เทียบเท่า (เช่น: Turn "5" เป็น "ห้า")
- คำศัพท์เป็นเสียง ที่อาเรย์ของคำจะถูกแปลงเป็นหน่วยเสียง หน่วยเสียงเป็นเสียงของแต่ละบุคคลในภาษา ในฐานะที่เป็นภาษาฮินดีมีประเภทการออกเสียงที่กว้างใหญ่การออกเสียงตามตัวอักษรภาษาฮินดีสามารถเปลี่ยนแปลงการออกเสียงของทั้งคำได้ ระบบได้แมปเสียงภาษาฮินดีไปกับตัวอักษรของพวกเขาแล้วดังนั้นเมื่อตรวจพบตัวอักษรระบบจะแมปกับไฟล์เสียงและส่งคืนหมายเลข เอาต์พุตเป็นรายการของตัวเลขที่แต่ละคนสอดคล้องกับหนึ่งใน 44 ภาษาฮินดีหน่วยเสียง
- หน่วยเสียงที่มีเสียง ซึ่งแต่ละฟอนิมจับคู่กับไฟล์เสียง นี่คือจุดที่เสียงจริงถูกเย็บเข้าด้วยกัน นอกจากนี้ยังอยู่ในขั้นตอนนี้ว่าเสียงที่ถูกต้องสำหรับเสียงถูกเลือกโดยสมมติว่ามีหลายเสียงที่ได้รับการสนับสนุน
อ้างถึง synthme หากต้องการให้มีการใช้งานภาษาอังกฤษในแบบเดียวกัน มันเป็นทรัพยากรที่สร้างแรงบันดาลใจและเป็นประโยชน์สำหรับเรา
งานในอนาคต
ตอนนี้ระบบมีเพียงเสียงเดียวนั่นคือของฉันและโครงการของฉัน @sarthaksavasil เราชอบที่จะเพิ่มเสียงอีกสองสามเสียงลงไป นอกจากนี้ฐานข้อมูล Phoneme นั้น จำกัด เพียง 44 ไฟล์เสียง (ในเวลาที่ฉันเขียนสิ่งนี้) ครอบคลุมตัวอักษรภาษาฮินดีที่สำคัญและใช้บ่อยทั้งหมด ดังนั้นเราจำเป็นต้องสร้างฐานข้อมูลการออกเสียงที่ใหญ่กว่า
มีส่วนร่วมถ้าคุณทำได้ มันจะช่วยเราและทำให้โครงการนี้เติบโตขึ้น
การพึ่งพาอาศัยกัน
โครงการนี้อาศัย
- Python 3x
- Re (สำหรับโทเค็น)
- Wave and OS (สำหรับการรวมไฟล์เสียงเข้าด้วยกัน)
การติดตั้ง
ทำตามขั้นตอนด้านล่างเพื่อลองใช้ synthesizer คำพูด
- ตรวจสอบให้แน่ใจว่าติดตั้งการพึ่งพาทั้งหมด
- เปิดเทอร์มินัลและนำทางไปยังไดเรกทอรีโคลน
- Run:
pip install -r requirements.txt - เรียกใช้คำสั่ง
**python3 SpeechSynthesis.py** - คุณจะได้รับแจ้งให้ป้อนข้อความ ป้อนสิ่งที่คุณต้องการให้ระบบพูดให้คุณ!
- โปรแกรมจะสร้างผลลัพธ์เป็นไฟล์. wav และสิ้นสุด เปิด output.wav เพื่อรับฟังผลลัพธ์