La plataforma de procesamiento del lenguaje natural Xiaomi (MINLP) tiene docenas de módulos funcionales como lexicografía, sintaxis y análisis semántico, y se ha utilizado ampliamente en el negocio de la compañía.
Después de la optimización continua y el pulido práctico, la herramienta de segmentación de palabras chinas Minlp-Tokenizer se abrió oficialmente al público en noviembre de 2020.
Planeamos completar el código abierto de todas las herramientas léxicas (anotación de parte de voz y reconocimiento de entidad nombrado) en el segundo trimestre de 2021. A partir del tercer trimestre de 2021, gradualmente abriremos el análisis de sintaxis de la fuente y algunas herramientas de análisis semántico, y trabajaremos con los desarrolladores para crear una plataforma NLP poderosa y potente.
La herramienta de análisis estructurado chino-chino de patito-fork es una horquilla JVM basada en Facebook/patito para cumplir con la conversión del texto a los objetos estructurados. Actualmente, las herramientas se utilizan ampliamente en el entorno de producción de Xiaoai, y la aplicación más importante es el análisis de números y tiempo.
Participio chino: Minlp-Tokenizer (portal)
Parte de la marca del habla: durante la construcción, estén atentos
Reconocimiento de la entidad nombrada: Estén atentos
Análisis de sintaxis de dependencia: estén atentos
Análisis estructurado: patito