Платформа обработки естественного языка Xiaomi (MINLP) имеет десятки функциональных модулей, таких как лексикография, синтаксис и семантический анализ, и широко используется в бизнесе компании.
После непрерывной оптимизации и практической полировки, инструмент сегментации китайского слова Minlp-Tokenizer был официально открыт для общественности в ноябре 2020 года.
Мы планируем завершить открытый исходный код всех лексических инструментов (аннотация части речи и названное распознавание сущности) во втором квартале 2021 года. Начиная с Q3 2021, мы будем постепенно анализ синтаксиса с открытым исходным кодом и некоторые инструменты семантического анализа и работать с разработчиками, чтобы создать мощную и ведущую платформу NLP.
Инструмент по структурированию синхронизации китайского языка с фарко-китайской китайской китайцы-это вилка JVM, основанная на Facebook/утенке, чтобы соответствовать конверсии из текста в структурированные объекты. В настоящее время инструменты широко используются в производственной среде Xiaoai, и наиболее важным применением является анализ чисел и времени.
Причастие Китая: Minlp-Tokenizer (портал)
Часть маркировки речи: Во время строительства, пожалуйста, следите за обновлениями
Названное признание сущности: следите за обновлениями
Анализ синтаксиса зависимости: следите
Структурированный анализ: утенка-форк-китайз