Les données vocales dans le langage kurde et les ressources associées telles que les TAG sont parmi les ressources linguistiques les plus essentielles nécessaires pour la recherche et les applications des PNL telles que la synthèse de la parole et la reconnaissance automatique de la parole, etc. Les données de la parole pour le Kurde central ont été créées et recueillies pour être utilisées dans la synthèse de la parole et la reconnaissance automatique de la parole dans le cadre de ce projet. Afin de créer ce corpus, 21 heures de discours ont été enregistrées et transcrites. Ce corpus se compose d'une conférencière de plus de 30 ans avec un baccalauréat et 10 979 phrases. Ces peines ont été enregistrées en studio pendant quatre mois. Un sous-ensemble du Asosoft Speech Corpus pour TTS est disponible en téléchargement pour la recherche et l'utilisation non commerciale. Ce sous-ensemble du corpus de la parole peut être utilisé pour la synthèse de la parole kurde centrale et d'autres applications de traitement du langage parlées. L'ensemble de données actuellement disponible se compose d'environ 01:02 (une heure et deux minutes) de paires de 522 "textes, audio". Fichiers: • .wav: fichier d'onde enregistré en 22,05 kHz, 16 bits, mono • .txt: transcription en kurde