Note | 訪問完整在線文檔mynlp.mayabot.com |
該章節介紹如何安裝和簡單使用mynlp的基礎功能。
mynlp已經發佈在Maven中央倉庫中,所以只需要在Maven或者Gradle中引入mynlp.jar依賴即可。
compile 'com.mayabot.mynlp:mynlp:4.0.0'
< dependency >
< groupId >com.mayabot.mynlp</ groupId >
< artifactId >mynlp</ artifactId >
< version >4.0.0</ version >
</ dependency >因為資源文件較大,所以mynlp.jar包默認不包括資源文件(詞典和模型文件)依賴。
懶人方案,通過引用mynlp-all依賴默認提供的資源詞典,滿足大部分需求。
compile 'com.mayabot.mynlp:mynlp-all:4.0.0'
| Gradle 坐標 | mynlp-all依賴 | 文件大小 | 說明 |
|---|---|---|---|
com.mayabot.mynlp.resource:mynlp-resource-coredict:1.0.0 | Y | 18.2M | 核心詞典(20w+詞,500w+二元) |
com.mayabot.mynlp.resource:mynlp-resource-pos:1.0.0 | Y | 17.5M | 詞性標註模型(感知機模型) |
com.mayabot.mynlp.resource:mynlp-resource-ner:1.0.0 | Y | 13.4M | 命名實體識別(人名識別、其他NER) |
com.mayabot.mynlp.resource:mynlp-resource-pinyin:1.1.0 | Y | 272K | 拼音詞典、拼音切分模型 |
com.mayabot.mynlp.resource:mynlp-resource-transform:1.0.0 | Y | 478K | 繁簡體詞典 |
com.mayabot.mynlp.resource:mynlp-resource-cws:1.0.0 | N | 62.4M | 感知機分詞模型 |
com.mayabot.mynlp.resource:mynlp-resource-custom:1.0.0 | N | 2.19M | 自定義擴展詞庫 |
根據實際的需要,按需引入資源包。
compile 'com.mayabot.mynlp:mynlp:3.2.0'
// 核心词典
implementation 'com.mayabot.mynlp.resource:mynlp-resource-coredict:1.0.0'
// 词性标注
implementation 'com.mayabot.mynlp.resource:mynlp-resource-pos:1.0.0'
// 命名实体
implementation 'com.mayabot.mynlp.resource:mynlp-resource-ner:1.0.0'
// 拼音
implementation 'com.mayabot.mynlp.resource:mynlp-resource-pinyin:1.1.0'
// 繁简体转换
implementation 'com.mayabot.mynlp.resource:mynlp-resource-transform:1.0.0'
// 感知机分词模型
// implementation 'com.mayabot.mynlp.resource:mynlp-resource-cws:1.0.0'
// 自定义扩展词库
// implementation 'com.mayabot.mynlp.resource:mynlp-resource-custom:1.0.0' mynlp.mayabot.com
HanLP
ansj_seg
mynlp實現參考了他們算法實現和部分代碼