TTS-Textanalyzer
Вдохновленный внедрением унифицированного анализатора нейронного текста: инновации для повышения точности произношения текста в речь, на основе модели BERT для объединения задач анализа текста синтеза речи, в том числе: сегментация слов, предсказание частичности, нормализацию текста, полифоническое слово, дисквиганое слово и т. Д. Это проект используется для получения данных для создания данных.
Вдохновленный внедрением унифицированного анализатора нейронного текста: инновации для нейронного анализа текста в речь текст в речь могут быть построены на модели BERT, включая: сегментация слова, тегирование частичной речи, нормализацию текста, дишащее полифона и т. Д. Этот проект используется для сбора информации DataSet, подходящей для каждой задачи.
Предварительно прозвучавший Берт
- БЕРТ-Базе-Китайз
- BERT-BASE-MULTYLYLYRINGUAL
- XLM-Roberta-Base
Слово сегментация
Часть речи
Нормализация текста
| наборы данных/правила | код |
|---|
| правила | WetextProcessing |
| Нормализация текста, покрывающая грамматики | TextNormalizationcoveringGrammars |
| Тодо | |
Полифонный устранение неоднозначности
| наборы данных | код |
|---|
| G2PL | https://github.com/whzikaros/g2pl |
| CPP (G2PM) | https://github.com/kakaobrain/g2pm |
| Тодо | |