TTS-Textanalyzer
Terinspirasi dengan memperkenalkan penganalisa teks saraf terpadu: Inovasi untuk peningkatan akurasi pengucapan teks-ke-pidato saraf, kepala beberapa tugas dapat dibangun berdasarkan model BerT untuk menyatukan tugas-tugas analisis teks sintesis pidato, termasuk: segmentasi kata, prediksi bagian-dari-pidato, normalisasi teks, kata-kata yang disedarkan.
Terinspirasi dengan memperkenalkan penganalisa teks saraf terpadu: inovasi untuk peningkatan akurasi pengucapan teks-ke-speech saraf, berbagai tugas analisis teks sinkronisasi bicara dapat dibangun pada model BerT, termasuk: segmentasi kata, penandaan bagian-of-speech, normalisasi teks, disambiguasi poliphone dan dll. Proyek ini digunakan untuk mengumpulkan informasi data yang cocok untuk setiap tugas.
Bert pretrained
- Bert-Base-Chinese
- Bert-Base-Base-Cased
- XLM-Roberta-Base
Segmentasi kata
Tagging bagian-of-speech
Normalisasi teks
| Dataset/Aturan | kode |
|---|
| aturan | WetextProcessing |
| Normalisasi teks yang menutupi tata bahasa | TextNormalizationCoveringinggrammars |
| Todo | |
Disambiguasi Polifon
| kumpulan data | kode |
|---|
| g2pl | https://github.com/whzikaros/g2pl |
| CPP (G2PM) | https://github.com/kakaobrain/g2pm |
| Todo | |