مشروع محاذاة النص إلى الكلام
نظرة عامة على المشروع
يستكشف هذا المشروع وتنفيذ العديد من تقنيات محاذاة النص إلى الكلام (TTS) ، بهدف تحسين جودة وكفاءة أنظمة TTS. يمتد عملنا إلى طرق متعددة ، كل منها يتناول جوانب مختلفة من تحدي المحاذاة.
هيكل المشروع
يتم تنظيم هذا المستودع في ثلاثة فروع رئيسية ، كل منها يمثل نهجًا متميزًا لمحاذاة TTS:
MoBoAligner
- الحالة : مكتمل ، للرجوع فقط
- الوصف : التنفيذ غير الرسمي لـ "moboaligner: نموذج محاذاة عصبي لـ TTS غير التوت مع البحث الحدود الرتيب"
- الغرض : التعلم ومقارنة خط الأساس
- القيد : غير مناسب للتطبيقات واسعة النطاق بسبب قيود المدة القصوى
RoMoAligner
- الحالة : توقف التنمية ، للرجوع إليها فقط
- الوصف : محاولة تحسين تجريبية الجمع بين المحاذاة الخشنة مع moboaligner
- الغرض : استكشاف تقنيات التعلم الخاضعة للإشراف ذاتيا في محاذاة TTS
- القيد : كانت تحسينات الأداء محدودة ولم تفي بالتوقعات
OTA ؟ التركيز الحالي
- الحالة : في التخطيط النشط والتطوير المبكر
- الوصف : تكييف طريقة "محاذاة TTS واحدة لتحكمهم جميعًا" (OTA) لنمذجة الإيقاف المؤقت الضمني
- الهدف : قم بتطوير حل للتعامل مع الإيقاف المؤقتة دون الاعتماد على رموز الصمت الصريحة
- التقدم : مرحلة التنمية والتخطيط المفاهيمي
التركيز الحالي
ينصب تركيزنا الأساسي على فرع OTA ، حيث نستكشف طرقًا لتكييف طريقة OTA لتحسين المحاذاة ، وخاصة في التعامل مع توقف مؤقت في الكلام.
كيفية استخدام هذا المستودع
- تحقق من كل فرع للحصول على تفاصيل التنفيذ المحددة والتقدم.
- ارجع إلى readmes الفرعية الفردية للحصول على تعليمات الإعداد والاستخدام.
- للحصول على أحدث التطورات ، ركز على فرع
OTA .
المساهمة
نرحب بالمساهمات في أي من فروعنا. إذا كنت مهتمًا بالمساهمة:
- تحقق من المشكلات في الفرع ذي الصلة للمهام التي يمكنك المساعدة فيها.
- مفترق المستودع وإنشاء طلب سحب مع تحسيناتك.
- للتغييرات الرئيسية ، يرجى فتح مشكلة أولاً لمناقشة ما تريد تغييره.
خريطة الطريق
شكر وتقدير
- ورقة moboaligner الأصلية
- ورقة OTA
نحن نقدر الدعم والاهتمام من مجتمع TTS ومجتمع معالجة الكلام في تقدم هذا البحث.