Modèle de bangla formé avec phonème.
Note de formation -> https://github.com/mobassir94/compreehensive-bangla-tts/blob/main/bn_vits_tts/bangla_phoneme_vits_trainer.ipynb
Test / Inference Notebook -> https://github.com/mobassir94/compehensive-bangla-tts/blob/main/bn_vits_tts/bangla_phoneme_vits_inference.ipynb
Tous les fichiers de poids -> https://www.kaggle.com/datasets/mobassir/compehensive-bangla-tts
Nous sommes ravis de vous faire savoir que le travail de Bangla TTS de ce dépôt est maintenant disponible en célèbre Coqui? TTS (Text-To-Speech), veuillez vérifier ceci -> https://github.com/coqui-ai/tts/releases et cette DeMo Colab également ->> aussi https://github.com/mobassir94/compehensive-bangla-tts/blob/main/bangla_text_to_speech_(tts).ipynb
Cependant, pour utiliser le pipeline TTS multilingue, vous avez toujours besoin de base de code de ce référentiel, merci
Avec une gentillesse infinie, une miséricorde et des bénédictions d'Allah, nous lançons aujourd'hui un système de lecteur de livre islamique open source pour tous ceux qui connaissent / parlent Bangla et l'arabe. Même si plus de 210 millions de personnes comme première langue ou seconde, Bangla est toujours une langue de ressources faible. C'est aussi une langue très difficile en raison de ses nombreux sons et règles d'orthographe. De plus, le script est très différent de l'anglais et d'autres langues latines.
L'objectif principal de faire une synthèse de parole multilingue complète était d'atteindre les gens à travers les hadiths bengalis et le Coran glorieux dans la langue bengali.
Collectez / grattez divers livres importants bangla-arabiques ou anglais-arabiques, les livres de Hadith, Tafsir et Seerah d'Internet et traduisent l'anglais-arabique en Bangla-arabique en utilisant un puissant traducteur de machine neurale de Bangla. Vous trouverez notre grattoir avec une documentation complète ici: https://github.com/mnansary/hadith-srcapper
À notre connaissance (de notre vaste recherche sur Google et de notre recherche sur Google et une vaste validation humaine), nous avons découvert que le système Bangla VITS TTS (texte à la parole) que nous avons formé et utilisé pour lire divers bangla tafsir / hadith Des systèmes comme GTTS, SILERO-TTS, INCI-TTS par grande marge en termes de qualité.
Tout premier pipeline de lecture de livres multilingues qui peut lire facilement les livres mixtes du code bangla + arabe.
Nous lisons tous les livres ou sources chapitre par chapitre et avons fait des livres audio.
effectué des livres audio à la conversion de livres vidéo à l'aide de ffmpeg
L'ensemble du processus peut ne pas être précis à 100%. La traduction anglaise à bengali peut contenir des erreurs dans de nombreux cas, ou parce qu'elle n'est pas lue par les humains (ce qui prend beaucoup de temps et coûte cher). Cela fait parfois des erreurs de prononciation critiques, mais nous espérons que ces problèmes seront résolus par l'amélioration ultérieure de ce travail insha'allah.
Nous avons utilisé Fantastic Coqui-ai? - Toolkit pour la formation de texte-to-vocation de Bangla avec un ensemble de données IITM converti au format LJSpeech. Nous avons formé 4 modèles et ils sont: Glowtts (mâle), Glowtts (femelle), VITS (mâle) et vits (femelle). Glowtts n'a pas fonctionné aussi bien que prévu car le coqui-ai a utilisé le vocodeur attaché. Afin d'améliorer les performances de GlowTTS, il faut former des modèles de spectrogramme et un vocodeur séparément et utiliser un voccodeur puissant à la place comme Hifi Gan 2. Les variantes masculines et féminines sont notre meilleur modèle que nous avons utilisé pour fabriquer la plupart des livres audio. À partir de ce carnet de démonstration complet_bangla_text_to_speech_ (TTS), vous pouvez voir la qualité sonore du modèle VITS est presque aussi bonne que l'ensemble de données de formation qui peut être trouvé ici: https://www.kaggle.com/datasets/mobassir/compehest-bangla-tts qui signifie bien finir les VITS peut clonier Le travail, une façon d'améliorer ses performances pourrait être de fabriquer un modèle G2P robuste pour Bangla et d'utiliser des phonèmes pendant la formation.
Chaque répertoire de ce dépôt contient un fichier .txt décrivant ce que font ces codes de dossiers particuliers.
Pour une démo d'inférence multilingue (bangla + arabe), vous pouvez consulter ce didacticiel Colab multilingue_ (ben + ara) _tts_inference_colab_demo.ipynb et le didacticiel vidéo de la version API de celui-ci est disponible ici
Découvrez certains des échantillons générés par notre système:
| Livres | Total_hadiths / Sourate ' | La machine neurale de l'anglais à Bangla est-elle traduite? | Discours neural synthétisé des livres audio multilingues (bangla + arabe) |
|---|---|---|---|
| তাফসীর ইবনে কাসীর | 114 (sourate) | Oui | https://www.youtube.com/playlist?list=PSHVXZXNUMVPOONPY0OM5F8USM66GEBWF |
| বাংলা সীরাহঃনবীজি সাল্লাল্লাহু আলাইহি ওয়াসাল্লাম এর জীবনী par le Dr Yasir Qadhi | 101 conférences | Oui | https://www.youtube.com/playlist?list=PSHVXZXNUMVPSBUQCL8OSWOXCPPZ2A3HT |
| তাফসীরে জাকারিয়া (TAFSIR ABU BAKAR ZAKARIA) | 114 (sourate) | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVOINTRZMEFFUBL5132E72YL |
| তাফসীরে আহসানুল বায়ান | 114 (sourate) | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVOT0A1IOQ5FUBQNDAJZ7PVJ |
| তাফসীরে জালালাইন (TAFSIR AL JALALAIN) | 114 (sourate) | Oui | https://www.youtube.com/playlist?list=PSHVXZXNUMVNBYBLHNONAIXW7BAS3YY2XB |
| সহিহ বুখারী | 7563 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVNILU0TJAQAAUAWR9DUZEDV |
| সহিহ মুসলিম | 7500 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVOMPGMZKY38RVOYWAWKSSDU |
| সুনানে আন-নাসায়ী | 5758 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVNOGSGULSPLEPRTR4WOUHZVT |
| সুনানে আবু দাউদ | 5274 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVNZ2QPUES46JTCRRWK4QF0I |
| জামে 'আত-তিরমিজি | 3956 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVMB31G0OEJLXMYLUFZRYC0X |
| সুনানে ইবনে মাজাহ | 4341 | Non | সুনানে ইবনে মাজাহ |
| মুয়াত্তা ইমাম মালিক | 1832 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVPN_8D5BN86OTQ9WFROCGGJ |
| রিয়াদুস সলেহিন | 1905 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVON9GUH8N28YBJIJV0C-ABC |
| বুলুগুল মারাম | 1568 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVMX11Dlgonalej3ieyvtxig |
| আল লু'লু ওয়াল মারজান | 1906 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVOEYSX1JHUO2TLZPMNMRVQ |
| হাদিস সম্ভার | 2013 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVPCCIT-AKPSJLS4KGABZOHB |
| সিলসিলা সহিহা | 60 | Non | https://www.youtube.com/watch?v=gevwwa8rx3q&list=plShvxzxnumvoszibj3szrjxt1uzh_k6n7&index=11 |
| জাল জয়িফ হাদিস সিরিজ | 102 | Non | https://www.youtube.com/watch?v=r1cu0aaib7y&list=plshvxzxnumvoszibj3szrjxt1uzh_k6n7 |
| মিশকাতুল মাসাবিহ | 2758 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVNNNPEAOIHXBWCMLRVBLKXB |
| ৪০ হাদিস | 42 | Non | https://www.youtube.com/watch?v=romcvpppVoe&list=plShvxzxnumvoszibj3szrjxt1uzh_k6n7&index=2 |
| আদাবুল মুফরাদ | 1336 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVNQFGS2D0DQHRX6_TYLNO1M |
| জুজ'উল রাফায়েল ইয়াদাইন | 56 | Non | https://www.youtube.com/watch?v=MQTAO_XEHGS&list=PSHVXZXNUMVOSZIBJ3SZRJXT1UZH_K6N7&index=9 |
| সহিহ হাদিসে কুদসি | 163 | Non | https://www.youtube.com/watch?v=MQUY6D6UFI&list=plShvxzxnumvoszZibj3Szrjxt1uzh_k6n7&index=8 |
| ১০০ সুসাব্যস্ত হাদিস | 101 | Non | https://www.youtube.com/watch?v=zbs-zyi3brw&list=plshvxzxnumvoszibj3szrjxt1uzh_k6n7&index=3 |
| মিশকাতে জয়িফ হাদিস | 106 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVOSZIBJ3SZRJXT1UZH_K6N7 |
| শামায়েলে তিরমিযি | 320 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVNDUIZMIAVAVAVWRUU0UEX2BW |
| সহিহ তারগিব ওয়াত তাহরিব | 200 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVPI5TG5CDOWBCWLQJXCSLBG |
| সহিহ ফাযায়েলে আমল | 151 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVMUPTUSJYKEFYWZTTWKZYW |
| ঊপদেশ | 234 | Non | https://www.youtube.com/playlist?list=PSHVXZXNUMVPZHCOR1GDHV0FM-6JE0GVM |
| রমযান বিষয়ে জাল ও দুর্বল হাদিসসমূহ | 36 | Non | https://www.youtube.com/watch?v=mji1v7e5ai8&list=plShvxzxnumvoszibj3szrjxt1uzh_k6n7&index=10 |
| মুসনাদে আহমাদ | |||
| জুজ'উল কিরাত | |||
| সুনান আদ-দারিমী | |||
| তাহাবী শরিফ | |||
| সুনান দারাকুতনী |
Références:
APSIS Solutions Ltd.
Bengali.ai