Речевые данные на курдском языке и связанных с ними ресурсах, таких как теги, являются одними из наиболее важных языковых ресурсов, необходимых для исследований и приложений НЛП, таких как синтез речи и автоматическое распознавание речи и т. Д. Речевые данные для центрального курда были созданы и собраны для использования в синтезе речи и автоматическом распознавании речи в рамках этого проекта. Чтобы создать этот корпус, 21 часа речи было записано и транскрибировано. Этот корпус состоит из докладчика старше 30 лет со степенью бакалавра и 10 979 приговоров. Эти предложения были записаны в студии в течение четырех месяцев. Подмножество речевого корпуса Asosoft для TTS доступно для загрузки для исследования и некоммерческого использования. Это подмножество речевого корпуса может быть использована для синтеза речи центральной курдской речи и других приложений обработки разговорного языка. В настоящее время доступный набор данных состоит из 01:02 (один час и две минуты) из 522 "текста, аудио" пар. Файлы: • .wav: волновой файл, записанный в 22,05 кГц, 16 -битный, моно • .txt: транскрипция на курдском