MiNLP
v3.3.1: 修复中文标点错误转换成英文标点问题
小米自然語言處理平台(MiNLP)具備詞法、句法、語義分析等數十個功能模塊,已經在公司業務中得到了廣泛應用。
MiNLP-Tokenizer中文分詞工具經過不斷優化和實戰打磨,已於2020年11月正式對外開源。
我們計劃在2021年Q2完成所有詞法工具(詞性標註和命名實體識別)的開源,從2021年Q3開始,我們將逐步開源句法分析和部分語義分析工具,和開發者一起打造功能強大、效果領先的NLP平台。
duckling-fork-chinese中文結構化解析工具,是在facebook/duckling的基礎上做的一個JVM fork,滿足從文本到結構化對象的轉換。目前工具在小愛生產環境大量使用,最重要的應用是在數字和時間上的解析。
中文分詞:MiNLP-Tokenizer(傳送門)
詞性標註:施工中,敬請期待
命名實體識別:敬請期待
依存句法分析:敬請期待
結構化解析:duckling-fork-chinese