? TECHOS DE DATAS DE DATAS DE TEXTO A LA TEXTO A LA DISECHO DE OPERACIÓN
Los textos para estos conjuntos de datos son de textos para el conjunto de datos de texto a discurso ucraniano
Comunidad
- Discord : https://bit.ly/discord-uds
- Reconocimiento de voz: https://t.me/speech_recognition_uk
- Síntesis del habla: https://t.me/speech_synthesis_uk
Conjunto de datos
Mira https://huggingface.co/datasets/yehor/opentts-uk
Voces
Femenino
Lata
- Calidad: alto
- Duración: 10h37m
- Formatos de audio: opus
- Frecuencia: 48000 Hz
Escuche la demostración (elija "Lada" en el campo de voz)
Tetiana
- Calidad: alto
- Duración: 8h
- Formatos de audio: opus
- Frecuencia: 48000 Hz
Kateryna
- Calidad: alto
- Duración: 2h40m
- Formatos de audio: opus
- Frecuencia: 48000 Hz
Masculino
Mykyta
- Calidad: alto
- Duración: 8h10m
- Formatos de audio: opus
- Frecuencia: 48000 Hz
Escuche la demostración (elija "Mykyta" en el campo de la voz)
Oleksa
- Calidad: alto
- Duración: 6h
- Formatos de audio: opus
- Frecuencia: 48000 Hz
Apariencia en la web
- Alinee el texto al audio y recorte el silencio: https://github.com/proger/uk
- Flowtron de Nvidia: https://github.com/egorsmkv/ukrainian-flowtron-tts
- HF Demos:
- https://huggingface.co/spaces/robinhad/ukrainian-tts
- https://huggingface.co/spaces/theodotus/ukrainian-voices
- Lada: conjunto de datos de texto a la especie de texto de alta calidad ucraniano: https://zenodo.org/record/7396774
- Google Colabs (modelo RADTTS):
- https://colab.research.google.com/drive/13aa0o9fqkndcjtplrgxhxwpvzpeuggcy?usp=sharing
- https://colab.research.google.com/drive/1pgiblmm4tk0atkrszstosy6xatdnc3v4?usp=sharing
- Lada está en Piper - https://github.com/rhasspy/piper - un sistema neuronal local de texto a voz rápido
- Tetiana en Balacoon - https://balacoon.com/blog/uk_release/
- Demostración: https://huggingface.co/spaces/balacoon/tts