تحليل الكلام/نظام التوليف ل TTS والتطبيقات ذات الصلة.
يعتمد هذا البرنامج على الطريقة الموضحة في الورقة:
F. Espic ، C. Valentini-Botinhao ، و S. King ، "النمذجة المباشرة للحجم وأطياف الطور لتوليف الكلام الباريبي الإحصائي" ، في بروك. Interspeech ، Stockholm ، Sweden ، August ، 2017.
@ المؤلف: فيليبي إسبك
مزيد من المعلومات في http://www.felipeespic.com/magphase/
هذا هو نظام تحليل/توليف الموجة الكلام المستخدم في تخليق الكلام الحدودي الإحصائي (SPSS).
تستخرج وحدة التحليل أربعة تدفقات ميزات تصف أطياف الحجم وأطياف الطور و F0. يمكن استخدام هذه الميزات لتدريب نموذج الانحدار (على سبيل المثال ، DNN ، LSTM ، HMM. وما إلى ذلك) لذلك ، يمكن إنشاء القيم المتوقعة. تأخذ وحدة التوليف هذه الميزات عند الإدخال لإنشاء شكل موجة توليف نهائي.
النقاط الرئيسية:
انظر ملف الترخيص للحصول على التفاصيل.
pip install numpy scipy soundfile matplotlib
تنزيل magphase: git clone https://github.com/CSTR-Edinburgh/magphase.git
قم بتنزيل وتجميع SPTK و REAPER بواسطة:
cd magphase/tools
./download_and_compile_tools.sh
سيؤدي ذلك إلى تجميع وتكوين SPTK و Reaper تلقائيًا لك ... وهذا كل شيء!
ما عليك سوى الانتقال إلى /demos ، وقراءة الإرشادات الموجودة داخل البرامج النصية التجريبية ، والتي هي مصابة للغاية. يجب أن تنفد من المربع عن طريق تشغيل python <demo_script> .
نوضح أنك تلعب أولاً مع demo_copy_synthesis_lossless.py ، ثم demo_copy_synthesis_low_dim.py يقومان بإجراء إجراءات التحليل/التوليف.
بعد ذلك ، يمكنك تعديل البرامج النصية التجريبية لتناسب احتياجاتك.
ملاحظة: فقط تذكر تشغيل البرامج النصية من مواقعها.
نحن نقدم اثنين من العروض التوزيعية مع التوزيع الرسمي لميرلين. هذه تظهر أمثلة على Merlin مع تكامل Magphase:
نص إلى كلام: عرض Merlin's SLT_ARCTIC (إصدارات مجموعة فرعية صغيرة وكاملة)
تحويل الصوت: عرض تحويل صوت ميرلين (تم اختباره تقريبًا)
نحن بحاجة إلى مساعدة لتحسين هذا البرنامج. يمكنك colaborate بواسطة:
بناء أصوات TTS باستخدام Merlin و Magphase ومقارنة مع المبراجين الآخرين ، على سبيل المثال ، العالم. ثم ، من فضلك قل لنا نتائجك. لقد قمنا باختبار Magphase فقط مع بعض الأصوات ويحتاج إلى تغطية نطاق أوسع. لقد أصلحنا مؤخرًا بعض الأخطاء التي خرجت بفضل الأشخاص الذين يبلغون عن نتائجهم باستخدام بيانات جديدة.
تنفيذ دعم معدل الإطار المتغير الأصلي في ميرلين. يعمل Magphase بطريقة متغيرة معدل الإطارات (متزامن الملعب).