??オープンソースのウクライナのテキストからスピーチデータセット
これらのデータセットのテキストは、ウクライナのテキストからスピードへのテキストからのものです
コミュニティ
- 不一致:https://bit.ly/discord-uds
- 音声認識:https://t.me/speech_recognition_uk
- 音声統合:https://t.me/speech_synthesis_uk
データセット
https://huggingface.co/datasets/yehor/opentts-ukを見てください
声
女性
ラダ
- 品質:高
- 期間:10H37M
- オーディオ形式:OPUS
- 周波数:48000 Hz
デモを聞いてください(音声フィールドで「ラダ」を選択してください)
テティアナ
- 品質:高
- 期間:8時間
- オーディオ形式:OPUS
- 周波数:48000 Hz
カテリナ
- 品質:高
- 期間:2H40M
- オーディオ形式:OPUS
- 周波数:48000 Hz
男
mykyta
- 品質:高
- 期間:8H10M
- オーディオ形式:OPUS
- 周波数:48000 Hz
デモを聞いてください(音声フィールドで「Mykyta」を選択してください)
オレクサ
- 品質:高
- 期間:6時間
- オーディオ形式:OPUS
- 周波数:48000 Hz
ウェブ上の外観
- テキストをオーディオとトリムサイレンスに合わせて:https://github.com/proger/uk
- nvidia's flowtron:https://github.com/egorsmkv/ukrainian-flowtron-tts
- HFデモ:
- https://huggingface.co/spaces/robinhad/ukrainian-tts
- https://huggingface.co/spaces/theodotus/ukrainian-voices
- LADA:ウクライナの高品質の女性のテキストからスピーチデータセット:https://zenodo.org/record/7396774
- Google Colabs(radttsモデル):
- https://colab.research.google.com/drive/13aa0o9fqkndcjtplrgxhxwpvzpeuggccy?usp = sharing
- https://colab.research.google.com/drive/1pgiblmm4tk0atkrszstosy6xatdnc3v4?usp = sharing
- LADAはPiperにいます-https://github.com/rhasspy/piper-速いローカルニューラルテキストから音声システム
- バラクーンのテチアナ-https://balacoon.com/blog/uk_release/
- デモ:https://huggingface.co/spaces/balacoon/tts