ข้อมูลการพูดในภาษาเคิร์ดและทรัพยากรที่เกี่ยวข้องเช่นแท็กเป็นหนึ่งในทรัพยากรภาษาที่สำคัญที่สุดที่จำเป็นสำหรับการวิจัย NLP และแอพพลิเคชั่นเช่นการสังเคราะห์เสียงพูดและการรู้จำเสียงพูดอัตโนมัติ ฯลฯ ข้อมูลการพูดสำหรับเคิร์ดกลางถูกสร้างและรวบรวมเพื่อใช้ในการสังเคราะห์เสียงพูดและการรู้จำเสียงพูดอัตโนมัติซึ่งเป็นส่วนหนึ่งของโครงการนี้ เพื่อสร้างคลังข้อมูลนี้ได้มีการบันทึกและถอดความ 21 ชั่วโมง คลังข้อมูลนี้ประกอบด้วยวิทยากรหญิงอายุมากกว่า 30 ปีด้วยปริญญาตรีและ 10,979 ประโยค ประโยคเหล่านี้ถูกบันทึกไว้ในสตูดิโอเป็นเวลาสี่เดือน ชุดย่อยของ Asosoft Speech Corpus สำหรับ TTS มีให้ดาวน์โหลดสำหรับการวิจัยและการใช้งานที่ไม่ใช่เชิงพาณิชย์ ชุดย่อยของคลังข้อมูลคำพูดนี้สามารถนำไปใช้สำหรับการสังเคราะห์คำพูดกลางเคิร์ดและแอพพลิเคชั่นการประมวลผลภาษาพูดอื่น ๆ ชุดข้อมูลที่มีอยู่ในปัจจุบันประกอบด้วยประมาณ 01:02 (หนึ่งชั่วโมงและสองนาที) จากการจับคู่ข้อความ 522 "เสียง" ไฟล์: • .wav: ไฟล์คลื่นที่บันทึกไว้ใน 22.05 kHz, 16 บิต, โมโน• .txt: การถอดความในเคิร์ด