تعد بيانات الكلام في اللغة الكردية والموارد المرتبطة بها مثل العلامات من بين أهم موارد اللغة اللازمة لبحوث NLP وتطبيقات مثل تخليق الكلام والتعرف على الكلام التلقائي ، إلخ. من أجل إنشاء هذه المجموعة ، تم تسجيل 21 ساعة من الكلام. تتكون هذه المجموعة من متحدثة أكثر من 30 عامًا بدرجة البكالوريوس و 10،979 جملة. تم تسجيل هذه الجمل في الاستوديو لمدة أربعة أشهر. تتوفر مجموعة فرعية من مجموعة Asosoft Speech for TTS للتنزيل للبحث والاستخدام غير التجاري. يمكن استخدام هذه المجموعة الفرعية من مجموعة الكلام لتخليق الكلام الكردي المركزي وتطبيقات معالجة اللغة المنطوقة الأخرى. تتكون مجموعة البيانات المتوفرة حاليًا من حوالي 01:02 (ساعة واحدة واثنين) من 522 من أزواج "النص والصوت". الملفات: • .wav: ملف الموجة المسجل في 22.05 كيلو هرتز ، 16bit ، أحادي • .txt: النسخ باللغة الكردية