نهاية مقرها في Kinyarwanda من DeepSpeech مع الكلام إلى النص والرسائل النصية لخدمات الكلام!
استكشف المستندات »
عرض العرض التوضيحي · الإبلاغ عن خطأ · طلب ميزة
مرحبًا بك في مستودع Kinyarwanda Deepspeech API! يوفر هذا الدليل الشامل استكشافًا متعمقًا لهذا الحل الشامل القوي لمعالجة الكلام في كينيارواندا. من خلال واجهة برمجة تطبيقات DeepSpeech الخاصة بنا ، يمكنك تحويل Kinyarwanda المنطوقة دون عناء وتحويل النص إلى خطاب Kinyarwanda الطبيعي. مقدمة
في العصر الرقمي اليوم ، يعد التواصل السلس عبر لغات متنوعة أمرًا بالغ الأهمية. API Deepspeech الخاص بنا لـ Kinyarwanda يجسد حواجز اللغة من خلال تقديم إمكانيات قوية للكلام إلى النص وإمكانيات النص المصمم خصيصًا للغة Kinyarwanda. سواء كنت تقوم ببناء تطبيقات صوتية تفاعلية أو نسخ محتوى الصوت أو تعزيز ميزات إمكانية الوصول ، فإن واجهة برمجة التطبيقات لدينا تمكنك من تحقيق أهدافك بسهولة. الميزات الرئيسية
Accurate Speech-to-Text Conversion: Leverage our advanced deep learning models to accurately transcribe spoken Kinyarwanda into written text. Our models have been trained on extensive Kinyarwanda speech datasets, ensuring high accuracy and reliability.
Natural Text-to-Speech Synthesis: Generate lifelike Kinyarwanda speech from textual input. Our text-to-speech engine produces natural intonation, rhythm, and pronunciation, creating a seamless and engaging user experience.
End-to-End Processing: Perform both speech-to-text and text-to-speech operations within a single API, streamlining your workflow and saving development time.
Customization: Fine-tune our models to adapt them to specific accents, dialects, or domains, ensuring optimal performance for your unique use case.
Scalability: Our API is designed to handle a high volume of requests, making it suitable for applications ranging from small-scale projects to large-scale enterprise solutions.
يقوم هذا النموذج بنسخ الكلام إلى الأبجدية اللاتينية الصغيرة بما في ذلك المساحات ، و apostroph ، ويتم تدريبه على حوالي 2000 ساعة من بيانات الكلام Kinyarwanda بواسطة Nvidia. إنه متغير "كبير" غير آخذ في مجال المطابق ، مع حوالي 120 مليون معلمة. راجع بنية النموذج ووثائق NEMO للحصول على تفاصيل الهندسة المعمارية الكاملة.
هذا النموذج عبارة عن Kinyarwanda text-to-to-tpesh (TTS) المستندة إلى تعلّم عميق (TTS) تم تطويره بواسطة Umuganda الرقمي. نظرًا لقدرات التعلم الصفرية ، يمكن تقديم أصوات جديدة بخطاب مدته دقيقة واحدة. تم تدريب النموذج باستخدام مكتبة TTS Coqui ، والهندسة المعمارية [1]. تم تدريبه على 67 ساعة من بيانات الكتاب المقدس Kinyarwanda ، مقابل 100 عصر.
(العودة إلى الأعلى)
(العودة إلى الأعلى)
هذا هو تنفس سيمبل يتطلب تشغيل أسطر قليلة من التعليمات البرمجية.
من الممكن أن يتم تشغيل التطبيق في حاوية Docker لتجنب أخطاء التبعية ، ولكن من الممكن أيضًا تشغيله بدون Docker من حيث المواصفات المطلوبة
اتبع الخطوات الملحوظة لإعداد مشروعك على الخادم/الجهاز الذي يقوم بتشغيل Docker.
git clone https://github.com/agent87/RW-DEEPSPEECH-API.gitgit lfs pullMONGO_INITDB_ROOT_USERNAME= " admin "
MONGO_INITDB_ROOT_PASSWORD= " Bingo123 "
MONGO_HOST= " mongo "
MONGO_PORT=27017
MONGO_INITDB_DATABASE= " Inference "
MONGO_STT_COLLECTION= " STT_INFERENCE_LOGS "
MONGO_TTS_COLLECTION= " TTS_INFERENCE_LOGS "
MAX_SPEECH_AUDIO_FILE_SIZE=1000
TTS_MAX_TXT_LEN=1000
LOG_LEVEL= " INFO "
PYTHONUNBUFFERED=1
DOMAIN= < Replace your DOMAIN here >
SERVER_IP_ADDRESS= < Replace your SERVER_IP_ADDRESS here >docker compose builddocker compose up(العودة إلى الأعلى)
إذا لم تكن لديك أجهزة محددة (GPU) ، فيمكنك تشغيل التطبيق على Google Colab. استخدم الرابط التالي لفتح دفتر الملاحظات واتبع الإرشادات الموجودة في دفتر الملاحظات لتشغيل التطبيق.
curl -X POST " http://server_url/stt " -H " accept: application/json " -H " Content-Type: multipart/form-data " -F " file=@/path/to/audio/file "curl -X POST " http://server_url/tts " -H " accept: application/json " -H " Content-Type: application/json " -d " { " text " : " string " } "(العودة إلى الأعلى)
راجع المشكلات المفتوحة للحصول على قائمة كاملة بالميزات المقترحة (والمشكلات المعروفة).
(العودة إلى الأعلى)
المساهمات هي التي تجعل مجتمع المصدر المفتوح مكانًا رائعًا للتعلم وإلهامه وإنشائه. أي مساهمات تقدمها موضع تقدير كبير .
إذا كان لديك اقتراح من شأنه أن يجعل هذا أفضل ، فيرجى تورك الريبو وإنشاء طلب سحب. يمكنك أيضًا فتح مشكلة مع علامة "تحسين". لا تنسى إعطاء المشروع نجمًا! شكرًا لك مرة أخرى!
git checkout -b feature/AmazingFeature )git commit -m 'Add some AmazingFeature' )git push origin feature/AmazingFeature )(العودة إلى الأعلى)
موزعة بموجب رخصة GNU العامة العامة. انظر LICENSE.txt لمزيد من المعلومات.
(العودة إلى الأعلى)
Arnaud Kayonga - @Kayarn - [email protected]
رابط المشروع: https://github.com/agent87/rw-deepseedesh-api
(العودة إلى الأعلى)
استخدم هذه المساحة لسرد الموارد التي تجدها مفيدة وترغب في إعطاء الائتمان. لقد قمت بتضمين عدد قليل من المفضلات الخاصة بي لبدء الأمور!
(العودة إلى الأعلى)