Minimania هو تطبيق ويب يوفر إمكانيات النص إلى الكلام (TTS) وقدرات الاستنساخ الصوتي. يستخدم التطبيق نماذج التعلم العميق لإنشاء إخراج الكلام عالي الجودة بلغات متعددة ، مع خيارات لتخصيص الملعب والسرعة وحجم الصوت الذي تم إنشاؤه. تم تصميم محرك TTS في Minimania على رأس طرز Tacotron 2 و WaveGlow ، في حين أن قدرات الاستنساخ الصوتية تستند إلى طرز Fastspeech و Melgan.
انقر على رابط Mega لمشاهدة العرض التوضيحي: رابط للفيديو
قبل أن تتمكن من تثبيت Mimicmania واستخدامه ، ستحتاج إلى تنزيل وتثبيت ما يلي:
apt-get install ffmpeg في المحطة الخاصة بك.sudo apt-get install espeak-ng في المحطة الخاصة بك.sudo apt-get install espeak في المحطة الخاصة بك.بالإضافة إلى ذلك ، ستحتاج أيضًا إلى تنزيل التبعيات المطلوبة للوحدة النمطية والبيثون كما هو موضح في القسم التالي.
لتثبيت وتشغيل التقليد ، اتبع هذه الخطوات:
git clone https://github.com/everydaycodings/MimicMania.gitcd MimicManiapython setup.py لتنزيل الوحدات النمطية المطلوبة. قد تستغرق هذه العملية بعض الوقت ، حيث أن الوحدة النمطية المطلوبة حوالي 6 جيجابايت.pip install -r requirements.txt لتنزيل جميع تبعيات Python.streamlit run app.py لبدء تطبيق الويب. إذا كنت ترغب في المساهمة في التقليد ، فيرجى تورك المستودع وإنشاء طلب سحب. نرحب بالمساهمات من جميع الأنواع ، بما في ذلك إصلاحات الأخطاء ، والميزات الجديدة ، وتحسين الوثائق.
تم تطوير Mimicmania بواسطة Kumar Saksham (كل يوم) بمساعدة موارد مفتوحة المصدر المختلفة.
نود أن نقدم شكرًا خاصًا لك إلى Coqui-Ai/TTS لتوفير نموذج النص إلى كلام الخاص بهم كمورد لمشروعنا.
تم ترخيص Mimicmania بموجب ترخيص MIT.
إذا كان لديك أي أسئلة أو مشكلات مع Mimicmania ، فيرجى الاتصال بنا على [email protected] أو التواصل معنا على TwitterDayDayCodings أو متوسطة @DeveryDayCodings.
يسعدنا دائمًا المساعدة!