AsoSoft TTS Speech Corpus for Central Kurdish
1.0.0
クルド語の音声データおよびタグなどの関連するリソースは、NLPの研究や音声合成や自動音声認識などのアプリケーションに必要な最も重要な言語リソースの1つです。このプロジェクトの一部として、音声統合と自動音声認識で使用するために、中央のクルド人の音声データが作成され、収集されました。このコーパスを作成するために、21時間の音声が記録され、転写されました。このコーパスは、学士号と10,979の文を持つ30歳以上の女性スピーカーで構成されています。これらの文は、4か月間スタジオに記録されました。 TTS用のAsosoft Speech Corpusのサブセットは、研究および非営利目的の使用のためにダウンロードできます。音声コーパスのこのサブセットは、中央クルドの音声統合およびその他の音声言語処理アプリケーションに使用できます。現在利用可能なデータセットは、約01:02(1時間と2分)の522 "テキスト、オーディオ「ペアリングで構成されています。ファイル:•.wav:22.05 kHz、16bit、mono•.txt:kurdishの転写で記録されたウェーブファイル