?? Наборы данных с открытым исходным кодом на наборе данных текста в речь
Тексты для этих наборов данных взяты из текстов для украинского набора данных текста в речь
Сообщество
- Discord : https://bit.ly/discord-uds
- Распознавание речи: https://t.me/speech_recognition_uk
- Синтез речи: https://t.me/speech_synthesis_uk
Набор данных
Посмотрите https://huggingface.co/datasets/yehor/opentts-uk
Голоса
Женский
Лада
- Качество: высокий
- Продолжительность: 10h37m
- Аудио форматы: опус
- Частота: 48000 Гц
Слушайте демонстрацию (выберите «Лада» в поле голоса)
Тетиана
- Качество: высокий
- Продолжительность: 8H
- Аудио форматы: опус
- Частота: 48000 Гц
Катерина
- Качество: высокий
- Продолжительность: 2H40M
- Аудио форматы: опус
- Частота: 48000 Гц
Мужской
Микита
- Качество: высокий
- Продолжительность: 8H10м
- Аудио форматы: опус
- Частота: 48000 Гц
Слушайте демонстрацию (выберите «Mykyta» в поле голоса)
Олека
- Качество: высокий
- Продолжительность: 6H
- Аудио форматы: опус
- Частота: 48000 Гц
Появление в Интернете
- Выровнять текст с аудио и отделкой тишины: https://github.com/proger/uk
- Nvidia's Flowtron: https://github.com/egorsmkv/ukrainian-flowtron-tts
- HF Demos:
- https://huggingface.co/spaces/robinhad/ukrainian-tts
- https://huggingface.co/spaces/theodotus/ukrainian-voices
- LADA: Украинский высококачественный женский набор данных текста в речь: https://zenodo.org/record/7396774
- Google Colabs (модель Radtts):
- https://colab.research.google.com/drive/13aa0o9fqkndcjtplrgxhxwpvzpeuggcy?usp=sharing
- https://colab.research.google.com/drive/1pgiblmm4tk0atkrszstosy6xatdnc3v4?usp=Sharing
- Лада в Piper - https://github.com/rhasspy/piper - быстрый локальный нейронный текст в речевую систему
- Tetiana в Balacoon - https://balacoon.com/blog/uk_release/
- Демо: https://huggingface.co/spaces/balacoon/tts