Вы можете обнаружить, что HERA публично доступны различные болгарские наборы данных и модели, используемые для задач ASR, TTS и NLP вместе с инструментами и приложениями с открытым исходным кодом. Я надеюсь опубликовать также мультимедийный корпус Spiken Bulgarian в различных профессорах.
Если у вас есть общедоступный набор данных и вы хотели бы поделиться с нами, пожалуйста, дайте мне знать. Это будет часто обновляться. Так что, пожалуйста, смотрите на этот репо;)
Систематизированные, общедоступные и доступные готовые модели и данные, которые можно найти в Интернете с некоторыми из известных программ для ASR, TTS, NLP и машинного перевода в болгарском. Также будут синхронизированные мультимедиа и текстовые файлы, необходимые для ASR. Этот архив содержит все, что вам нужно, чтобы сделать голосовой помощник в болгарском языке. В папке DOCS будет прокомментировать все приложения, которые поддерживают язык BG и работают с данными и моделями в болгарском языке.
Вы можете написать: «Antouan.bg @ gmiil dot com» для получения дополнительной информации или, если вы хотите включить вас в качестве сотрудников. Если вы не можете дать звездочку, потому что я трачу много времени на систематизацию.
София, сентябрь, 2019
Антуан Ангелов