Tts-textanalyzer
Inspirado por la introducción de un analizador de texto neuronal unificado: una innovación para la mejora de la precisión de la pronunciación de texto a voz neuronal, se pueden construir cabezas de múltiples tareas en función del modelo BERT para unificar las tareas del análisis de texto de síntesis de discurso, incluida: segmentación de palabras, predicción de parte del tiempo, normalización de texto, disambiguación de palabras polifónicas, etc. Este proyecto se utiliza para recopilar información de datos adecuada para cada tarea.
Inspirado por la introducción de un analizador de texto neuronal unificado: una innovación para la mejora de la precisión de la pronunciación del texto a la voz neuronal, se pueden construir diferentes tareas del análisis de texto de sincronización del habla en el modelo BERT, que incluye: segmentación de palabras, etiquetado de parte de voz, normalización de texto, desambiguación de poliphone, etc. Este proyecto se usa para recopilar información de datos adecuada para cada tarea.
Bert del estado previo
- Bert-Base-china
- de base-mulultilingüe
- XLM-ROBERTA-BASE
Segmentación de palabras
| conjuntos de datos | código |
|---|
| HACER | |
Etiquetado de parte del discurso
| conjuntos de datos | código |
|---|
| HACER | |
Normalización del texto
| conjuntos de datos/reglas | código |
|---|
| normas | Procesamiento de wetext |
| Normalización de texto que cubre las gramáticas | TextNormalizationCoveringGrammars |
| HACER | |
Desambiguación de poliphone
| conjuntos de datos | código |
|---|
| G2PL | https://github.com/whzikaros/g2pl |
| CPP (G2PM) | https://github.com/kakaobrain/g2pm |
| HACER | |