Sprachdaten in der kurdischen Sprache und zugehörigen Ressourcen wie Tags gehören zu den wichtigsten Sprachressourcen, die für NLP -Forschung und Anwendungen wie Sprachsynthese und automatische Spracherkennung usw. erforderlich sind. Sprachdaten für zentrales Kurdisch wurden erstellt und gesammelt, um die Sprachsynthese und die automatische Spracherkennung als Teil dieses Projekts zu verwenden. Um diesen Korpus zu erstellen, wurden 21 Stunden Sprache aufgezeichnet und transkribiert. Dieser Korpus besteht aus einer weiblichen Sprecherin über 30 Jahre mit einem Bachelor -Abschluss und 10.979 Sätzen. Diese Sätze wurden vier Monate im Studio aufgenommen. Eine Teilmenge des Asosoft Speech Corpus für TTS steht für Forschung und nicht kommerzielle Verwendung zum Download zur Verfügung. Diese Untergruppe des Sprachkorpus kann für die zentrale kurdische Sprachsynthese und andere Anwendungen für gesprochene Sprachverarbeitungen verwendet werden. Der derzeit verfügbare Datensatz besteht aus ca. 01:02 (eine Stunde und zwei Minuten) von 522 "Text, Audio" -Paarungen. Dateien: • .wav: Wellendatei in 22.05 kHz, 16bit, mono • .txt: Transkription in Kurdisch