Data pidato dalam bahasa Kurdi dan sumber daya terkait seperti tag adalah salah satu sumber bahasa paling penting yang diperlukan untuk penelitian dan aplikasi NLP seperti sintesis bicara dan pengenalan suara otomatis, dll. Data pidato untuk Kurdi pusat diciptakan dan dikumpulkan untuk digunakan dalam sintesis pidato dan pengenalan bicara otomatis sebagai bagian dari proyek ini. Untuk membuat korpus ini, 21 jam pidato telah direkam dan ditranskripsikan. Corpus ini terdiri dari penutur wanita lebih dari 30 tahun dengan gelar sarjana dan 10.979 kalimat. Kalimat -kalimat ini dicatat di studio selama empat bulan. Subset dari Asosoft Speech Corpus untuk TTS tersedia untuk diunduh untuk penelitian dan penggunaan non-komersial. Subset corpus pidato ini dapat digunakan untuk sintesis pidato Kurdi pusat dan aplikasi pemrosesan bahasa lisan lainnya. Dataset yang tersedia saat ini terdiri dari sekitar 01:02 (satu jam dan dua menit) dari pasangan 522 "Teks, Audio". File: • .wav: File gelombang direkam dalam 22.05 kHz, 16bit, mono • .txt: transkripsi dalam bahasa Kurdi