โครงการจัดตำแหน่งข้อความเป็นคำพูด
ภาพรวมโครงการ
โครงการนี้สำรวจและใช้เทคนิคการจัดตำแหน่งแบบข้อความเป็นคำพูดต่าง ๆ (TTS) โดยมีวัตถุประสงค์เพื่อปรับปรุงคุณภาพและประสิทธิภาพของระบบ TTS งานของเราครอบคลุมหลายวิธีการที่อยู่ในแง่มุมต่าง ๆ ของความท้าทายการจัดตำแหน่ง
โครงสร้างโครงการ
ที่เก็บนี้จัดเป็นสามสาขาหลักแต่ละแห่งเป็นตัวแทนของวิธีการที่แตกต่างกันในการจัดตำแหน่ง TTS:
MoBoAligner
- สถานะ : เสร็จสิ้นสำหรับการอ้างอิงเท่านั้น
- คำอธิบาย : การใช้งานอย่างไม่เป็นทางการของ "moboaligner: รูปแบบการจัดตำแหน่งของระบบประสาทสำหรับ TTS ที่ไม่ได้เป็นแบบอัตโนมัติด้วยการค้นหาขอบเขต monotonic"
- วัตถุประสงค์ : การเรียนรู้และการเปรียบเทียบพื้นฐาน
- ข้อ จำกัด : ไม่เหมาะสำหรับการใช้งานขนาดใหญ่เนื่องจากข้อ จำกัด ระยะเวลาสูงสุด
RoMoAligner
- สถานะ : การพัฒนาหยุดชะงักสำหรับการอ้างอิงเท่านั้น
- คำอธิบาย : ความพยายามในการปรับปรุงการทดลองรวมการจัดตำแหน่งคร่าวๆกับ moboaligner
- วัตถุประสงค์ : สำรวจเทคนิคการเรียนรู้ที่ดูแลตนเองในการจัดตำแหน่ง TTS
- ข้อ จำกัด : การปรับปรุงประสิทธิภาพมี จำกัด และไม่เป็นไปตามความคาดหวัง
OTA ? โฟกัสปัจจุบัน
- สถานะ : ในการวางแผนอย่างแข็งขันและการพัฒนาก่อน
- คำอธิบาย : การปรับตัวของ "การจัดตำแหน่ง TTS หนึ่งครั้งเพื่อปกครองพวกเขาทั้งหมด" (OTA) สำหรับการสร้างแบบจำลองการหยุดชั่วคราวโดยนัย
- เป้าหมาย : พัฒนาวิธีแก้ปัญหาสำหรับการจัดการโดยนัยชั่วคราวโดยไม่ต้องพึ่งพาโทเค็นความเงียบที่ชัดเจน
- ความคืบหน้า : ขั้นตอนการพัฒนาและวางแผนแนวคิด
โฟกัสปัจจุบัน
จุดสนใจหลักของเราคือสาขา OTA ซึ่งเรากำลังสำรวจวิธีการปรับวิธี OTA เพื่อการจัดตำแหน่งที่ดีขึ้นโดยเฉพาะอย่างยิ่งในการจัดการการหยุดโดยนัยในการพูด
วิธีใช้ที่เก็บนี้
- ตรวจสอบแต่ละสาขาสำหรับรายละเอียดการใช้งานเฉพาะและความคืบหน้า
- อ้างถึงการอ่านข้อมูลแต่ละสาขาสำหรับคำแนะนำการตั้งค่าและการใช้งาน
- สำหรับการพัฒนาล่าสุดมุ่งเน้นไปที่สาขา
OTA
การบริจาค
เรายินดีต้อนรับการมีส่วนร่วมในสาขาใด ๆ ของเรา หากคุณสนใจที่จะมีส่วนร่วม:
- ตรวจสอบปัญหาในสาขาที่เกี่ยวข้องสำหรับงานที่คุณสามารถช่วยได้
- แยกที่เก็บและสร้างคำขอดึงด้วยการปรับปรุงของคุณ
- สำหรับการเปลี่ยนแปลงครั้งใหญ่โปรดเปิดปัญหาก่อนเพื่อหารือเกี่ยวกับสิ่งที่คุณต้องการเปลี่ยนแปลง
แผนงาน
กิตติกรรมประกาศ
- กระดาษ moboaligner ดั้งเดิม
- กระดาษโอต้า
เราขอขอบคุณการสนับสนุนและความสนใจจาก TTS และชุมชนประมวลผลคำพูดในการพัฒนางานวิจัยนี้