ForwardTacotron NVDA
1.0.0
ملاحظة: لا تزال هذه الوظيفة الإضافية وكذلك الوثائق قيد الإنشاء. مساهماتك مرحب بها!
تذكر أن forwardtacotron هو نموذج توليف الكلام في pytorch يستخدم تنبؤ المدة لمحاذاة النص وتوليد طيف MEL. يتمتع هذا النموذج بمزايا ، مثل المتانة والسرعة والتلاعب والطاقة والكفاءة.
لذلك ، هذا البرنامج المساعد هو محاولة لتنفيذ الدعم لـ ForwardTacotron في قارئ الشاشة المفتوحة المصدر من NVDA عبر العميل/الخادم ، لأن المكتبات المستخدمة كشعلة لا يمكن تضمينها في NVDA مباشرة.
هذا عمل مستمر ، وبالتالي لا يزال هناك الكثير مما يجب فعله.
في غضون ذلك ، يمكنك الاستماع إلى التقدم الذي تم إحرازه حتى الآن.
| لغة | صوت | عينة |
|---|---|---|
| إنجليزي | ljspeech (مع griffinlim vocoder) | |
| إنجليزي | LJSPEEDE (مع HIFI-GAN VOCODER) | |
| الأسبانية | مجموعة بيانات ALD (مع HIFI-GAN VOCODER) | |
| الأسبانية | ODAL (مع HIFI-GAN VOCODER ، نموذج عالمي) |