?? Ensembles de données ukrainiens de texte vocale ukrainien
Les textes de ces ensembles de données proviennent de textes pour l'ensemble de données ukrainien de texte à dispection
Communauté
- Discord : https://bit.ly/discord-uds
- Reconnaissance de la parole: https://t.me/speech_recognition_uk
- Synthèse de la parole: https://t.me/speech_synthesis_uk
Ensemble de données
Regardez https://huggingface.co/datasets/yehor/opentts-uk
Voix
Femelle
Lada
- Qualité: élevé
- Durée: 10h37m
- Formats audio: opus
- Fréquence: 48000 Hz
Écoutez la démo (choisissez "lada" dans le champ vocal)
Tétiana
- Qualité: élevé
- Durée: 8h
- Formats audio: opus
- Fréquence: 48000 Hz
Kateryna
- Qualité: élevé
- Durée: 2h40m
- Formats audio: opus
- Fréquence: 48000 Hz
Mâle
Mykyta
- Qualité: élevé
- Durée: 8h10m
- Formats audio: opus
- Fréquence: 48000 Hz
Écoutez la démo (choisissez "Mykyta" dans le champ vocal)
Oleksa
- Qualité: élevé
- Durée: 6h
- Formats audio: opus
- Fréquence: 48000 Hz
Apparence sur le Web
- Alignez le texte sur le silence audio et coupez: https://github.com/proger/uk
- Nvidia's Flowtron: https://github.com/egorsmkv/ukrainian-flowtron-tts
- Démos HF:
- https://huggingface.co/spaces/robinhad/ukrainian-tts
- https://huggingface.co/spaces/theodotus/ukrainian-voices
- LADA: Ukrainien de haute qualité féminin Text-to-Speech DataSet: https://zenodo.org/record/7396744
- Google Colabs (modèle RADTTS):
- https://colab.research.google.com/drive/13aa0o9fqkndcjtplrgxhxwpvzpeUggcy?usp=sharing
- https://colab.research.google.com/drive/1pgiblmm4tk0atkrszstosy6xatdnc3v4?usp=sharing
- Lada est dans Piper - https://github.com/rhasspy/piper - un texte neuronal rapide et local au système vocal
- Tetiana à Balacoon - https://balacoon.com/blog/uk_release/
- Demo: https://huggingface.co/spaces/balacoon/tts