بيثون الهندية TTS
إنه نظام متسلسل للنص إلى كلام يتم تنفيذه في بيثون.
لقد بدأنا هذا المشروع في أكتوبر 2021 كمشروع عمل معالجة اللغة الطبيعية .
ينشئ نظام النص إلى كلام متسلسل تمثيلًا صوتيًا للنص من خلال لصق مجموعة من ملفات الصوت الصغيرة لتشكيل كل الإخراج بالكامل.
هناك ثلاث خطوات ، بما في ذلك:
- نص إلى كلمة ، حيث يتم رمز نص الإدخال الخام في قائمة الكلمات. يتضمن هذا أيضًا أيضًا تحويل الأرقام العددية إلى معادلات كلماتهم (على سبيل المثال: Turn "5" إلى "Five").
- كلمات إلى phonemes ، حيث يتم تحويل مجموعة الكلمات إلى صوتيات. الصوتيات هي الأصوات الفردية بلغة. نظرًا لأن الهندية لديها نوع صوتي شاسع للغاية ، فإن النطق الأبجدي الهندي يمكن أن يختلف بتغيير نطق الكلمة بأكملها. قام النظام بالفعل بتعيين الأصوات الصوتية الهندية إلى الحروف الحرارية ، لذلك كلما تم اكتشاف الأبجدية ، يقوم النظام فقط بتعيين ملف الصوت الخاص به وإرجاع رقمه. الإخراج عبارة عن قائمة بالأرقام التي تتوافق مع كل من 44 الصوتيات الهندية.
- الصوتيات إلى الأصوات ، حيث يتم إقران كل صوتي بملف صوتي. هذه هي النقطة التي يتم فيها خياطة الصوت الفعلي معًا. سيكون أيضًا في هذه الخطوة تحديد الصوت الصحيح للصوت ، على افتراض دعم أصوات متعددة.
ارجع إلى synthme إذا أردت تنفيذ اللغة الإنجليزية لنفسه. لقد كان موردًا ملهمًا ومفيدًا حقًا.
العمل المستقبلي
في الوقت الحالي ، يحتوي النظام على صوت واحد فقط ، وهو لي و Project Buddy's @Sarthaksavasil. نود أن نضيف بعض الأصوات الأخرى. كما تقتصر قاعدة بيانات Phoneme على 44 ملفًا صوتيًا فقط (في الوقت الذي أكتب فيه هذا) تغطي جميع الحروف الهندية الرئيسية التي تستخدم بشكل متكرر. لذلك نحن بحاجة إلى بناء قاعدة بيانات صوت صوتي أكبر.
تساهم في ذلك إذا استطعت. سوف يساعدنا حقًا وجعل هذا المشروع ينمو.
التبعيات
يعتمد هذا المشروع على
- بيثون 3x.
- إعادة (للرمز)
- Wave و OS (لتكوين ملفات الصوت معًا)
تثبيت
اتبع الخطوات أدناه لتجربة مزج الكلام.
- تأكد من تثبيت جميع التبعيات.
- افتح محطة وانتقل إلى الدليل المستنسخ.
- تشغيل:
pip install -r requirements.txt - قم بتشغيل الأمر
**python3 SpeechSynthesis.py** - سيُطلب منك إدخال رسالة. أدخل ما تريد أن يقوله النظام لك!
- سيقوم البرنامج بإنشاء الإخراج كملف .wav والنهاية. Open Output.wav لسماع النتيجة.