? Os conjuntos de dados de texto para fala ucranianos de código aberto
Os textos para esses conjuntos de dados são de textos para o conjunto de dados ucraniano de texto para fala
Comunidade
- Discord : https://bit.ly/discord-uds
- Reconhecimento da fala: https://t.me/speech_recognition_uk
- Síntese de fala: https://t.me/speech_synthesis_uk
Conjunto de dados
Olhe https://huggingface.co/datasets/yehor/opentts-uk
Vozes
Fêmea
Lada
- Qualidade: alta
- Duração: 10H37M
- Formatos de áudio: Opus
- Frequência: 48000 Hz
Ouça a demonstração (escolha "Lada" no campo de voz)
Tetiana
- Qualidade: alta
- Duração: 8h
- Formatos de áudio: Opus
- Frequência: 48000 Hz
Kateryna
- Qualidade: alta
- Duração: 2H40m
- Formatos de áudio: Opus
- Frequência: 48000 Hz
Macho
Mykyta
- Qualidade: alta
- Duração: 8H10m
- Formatos de áudio: Opus
- Frequência: 48000 Hz
Ouça a demonstração (escolha "Mykyta" no campo de voz)
Oleksa
- Qualidade: alta
- Duração: 6h
- Formatos de áudio: Opus
- Frequência: 48000 Hz
Aparência na web
- Alinhe o texto ao áudio e corte o silêncio: https://github.com/proger/uk
- Flowtron da NVIDIA: https://github.com/egorsmkv/ukrainian-flowtron-tts
- Demos de HF:
- https://huggingface.co/spaces/robinhad/ukrainian-tts
- https://huggingface.co/spaces/theodotus/ukrainian-voices
- LADA: Ucraniano Dataset de texto em fala feminina de alta qualidade: https://zenodo.org/record/7396774
- Google Colabs (modelo RADTTS):
- https://colab.research.google.com/drive/13aa0o9fqknndcjtplrgxhxwpvzpeuggcccy ?usp=sharing
- https://colab.research.google.com/drive/1pgiblmm4tk0atkrsziosy6xatdnc3v4?usp=sharing
- Lada está em Piper - https://github.com/rhasspy/piper - um sistema de texto neural rápido e local para a fala
- Tetiana em Balacoon - https://balacoon.com/blog/uk_release/
- Demo: https://huggingface.co/spaces/balacoon/tts