TTS-Textanalyzer
مستوحى من إدخال محلل النص العصبي الموحد: ابتكار لدقة نطق النص العصبي إلى الكلام ، يمكن إنشاء رؤوس المهام المتعددة بناءً على نموذج BERT لتوحيد مهام تحليل نص توليف الكلام ، بما في ذلك: تجميع الكلمات ، والتنبؤ جزء الكلام ، والتخليص النصفي ، وتنظيم الكلمة polyphonic ، إلخ.
مستوحاة من إدخال محلل النص العصبي الموحد: يمكن بناء ابتكار لتحسين دقة النطق النصية العصبية إلى الكلام ، ومهام مختلفة من تحليل نصي مزامنة الكلام على نموذج BERT ، بما في ذلك: تجزئة الكلمات ، وعلامة جزء من الكلام ، وتطبيع النص ، وتطبيع polyphone ، وما إلى ذلك. يستخدم هذا المشروع لجمع معلومات مجموعة البيانات.
بيرت المسبق
- بيرت-القاعدة الصينية
- bert-base-multingual
- XLM-Roberta-base
تجزئة الكلمات
| مجموعات البيانات | شفرة |
|---|
| تودو | |
وضع علامة على جزء من الكلام
| مجموعات البيانات | شفرة |
|---|
| تودو | |
تطبيع النص
| مجموعات البيانات/القواعد | شفرة |
|---|
| قواعد | المعالجة المبللة |
| تطبيع النص الذي يغطي القواعد النحوية | textNormalizationCoveringgrammars |
| تودو | |
polyphone disambiguation
| مجموعات البيانات | شفرة |
|---|
| G2PL | https://github.com/whzikaros/g2pl |
| CPP (G2PM) | https://github.com/kakaobrain/g2pm |
| تودو | |