Puede encontrar públicamente disponibles diferentes conjuntos de datos y modelos búlgaros utilizados para tareas ASR, TTS y PNL junto con herramientas y aplicaciones de código abierto. Espero publicar también un corpus multimedia de Spiken Búlgaro en diferentes dominios profesionales.
Si tiene un conjunto de datos de avalén públicamente y desea compartir con nosotros, hágamelo saber. Se actualizará con frecuencia. Así que por favor establezca este repositorio;)
Modelos y datos preparados sistematizados, abiertos públicamente y asequibles que se pueden encontrar en Internet con algunos de los programas conocidos para la traducción ASR, TTS, NLP y automáticamente en búlgaro. También habrá archivos multimedia y de texto sincronizados necesarios para ASR. Este archivo contiene todo lo que necesita para hacer un asistente de voz en búlgaro. La carpeta DOCS tendrá un comentario sobre todas las aplicaciones que admiten el lenguaje BG y funcionan con datos y modelos en Bulgarian.
Puede escribir a: "antouan.bg @ gmiil dot com" para obtener más información o si desea incluirlo como colaboradores. Si no puede dar un asterisco porque paso mucho tiempo para sistematizar.
Sofía, septiembre de 2019
Antuan Angelov