?開源烏克蘭文字到語音數據集
這些數據集的文本來自烏克蘭文本到語音數據集的文本
社區
- 不和諧:https://bit.ly/discord-uds
- 語音識別:https://t.me/speech_recognition_uk
- 語音綜合:https://t.me/speech_synthesis_uk
數據集
看https://huggingface.co/datasets/yehor/opentts-uk
聲音
女性
拉達
- 質量:高
- 持續時間:10h37m
- 音頻格式:作品
- 頻率:48000 Hz
聽演示(在語音字段中選擇“ LADA”)
提亞娜
- 質量:高
- 持續時間:8H
- 音頻格式:作品
- 頻率:48000 Hz
Kateryna
- 質量:高
- 持續時間:2H40M
- 音頻格式:作品
- 頻率:48000 Hz
男性
mykyta
- 質量:高
- 持續時間:8h10m
- 音頻格式:作品
- 頻率:48000 Hz
聽演示(在語音字段中選擇“ Mykyta”)
Oleksa
- 質量:高
- 持續時間:6H
- 音頻格式:作品
- 頻率:48000 Hz
在網上出現
- 將文字與音頻和修剪沉默相結合:https://github.com/proger/uk
- NVIDIA的Flowtron:https://github.com/egorsmkv/ukrainian-flowtron-tts
- HF演示:
- https://huggingface.co/spaces/robinhad/ukrainian-tts
- https://huggingface.co/spaces/theodotus/ukrainian-voices
- LADA:烏克蘭高品質的女性文本到語音數據集:https://zenodo.org/record/7396774
- Google Colabs(RADTTS模型):
- https://colab.research.google.com/drive/13aa0o9fqkndcjtplrgxhxhxwpvzpeuggcy?usp=sharing
- https://colab.research.google.com/drive/1pgiblmm4tk0atkrszstosy6xatdnc3v4? usp = sharing
- Lada在Piper -https://github.com/rhasspy/piper-快速,本地神經文本到語音系統
- tetiana在巴拉龍 - https://balacoon.com/blog/uk_release/
- 演示:https://huggingface.co/spaces/balacoon/tts