Los datos del habla en el idioma kurdo y los recursos asociados, como las etiquetas, se encuentran entre los recursos del lenguaje más esenciales necesarios para la investigación y las aplicaciones de PNL, como la síntesis del habla y el reconocimiento automático de voz, etc. Los datos del habla para el kurdo central se crearon y se reunieron para usar en la síntesis del habla y el reconocimiento automático del habla como parte de este proyecto. Para crear este corpus, se han registrado y transcrito 21 horas de discurso. Este corpus consiste en una oradora mayor de 30 años con una licenciatura y 10,979 oraciones. Estas oraciones se grabaron en el estudio durante cuatro meses. Un subconjunto del Asosoft Speech Corpus para TTS está disponible para descargar para la investigación y el uso no comercial. Este subconjunto del corpus del habla se puede utilizar para la síntesis del habla kurda central y otras aplicaciones de procesamiento del lenguaje hablado. El conjunto de datos disponible actualmente consta de aproximadamente 01:02 (una hora y dos minutos) de 522 emparejamientos de texto, audio ". Archivos: • .wav: archivo de onda registrado en 22.05 kHz, 16 bits, mono • .txt: transcripción en kurdish