Os dados da fala na linguagem curda e nos recursos associados, como tags, estão entre os recursos mais essenciais de linguagem necessários para pesquisa e aplicações de PNL, como síntese de fala e reconhecimento automático de fala, etc. Os dados de fala para o curdo central foram criados e reunidos para usar na síntese da fala e reconhecimento automático de fala como parte deste projeto. Para criar este corpus, 21 horas de fala foram registradas e transcritas. Este corpus consiste em uma oradora com mais de 30 anos com um diploma de bacharel e 10.979 frases. Essas frases foram registradas no estúdio por quatro meses. É disponível Este subconjunto do corpus de fala pode ser utilizado para a síntese central de fala curda e outros aplicativos de processamento de idiomas falados. O conjunto de dados atualmente disponível consiste em cerca de 01:02 (uma hora e dois minutos) de pares de 522 "texto, áudio". Arquivos: • .wav: arquivo de onda gravado em 22,05 kHz, 16bits, mono • .txt: transcrição em curdos