opennlp
OpenNLP 2.5.1
Apache OpenNLP庫是一種基於機器學習的工具包,用於處理自然語言文本。
該工具包完全寫在Java中,並為常見的NLP任務提供了支持,例如令牌化,句子分割,言論部分標記,命名實體提取,分解,解析,核心分辨率分辨率,語言檢測等等!
通常需要這些任務來構建更高級的文本處理服務。
OpenNLP項目的目標是成為上述任務的成熟工具包。
另一個目標是為各種語言提供大量的預製模型,以及這些模型的帶註釋的文本資源。
目前,OpenNLP包括常見的分類器,例如最大熵,感知器和天真的貝葉斯。
可以通過其Java API或通過其CLI從終端進行編程方式使用OpenNLP。可以輕鬆地將OpenNLP API插入分佈式流數據管道中,例如Apache Flink,Apache Nifi,Apache Spark。
有關其他信息,請訪問OpenNLP主頁
您可以使用任何語言使用OpenNLP,此處提供了演示模型。
這些模型與最新版本完全兼容,它們可用於測試或入門。
筆記
請為所有其他用例訓練自己的型號。
文檔,包括javadocs,代碼使用和命令行界面示例此處可用
對於最近的新聞,更新和主題,您可以:
請檢查社區的OpenNLP問題和答案。
目前,圖書館有不同的軟件包:
opennlp-tools :核心工具包。opennlp-tools-models :一組從類Pather加載OpenNLP模型的類。opennlp-uima :一組Apache UIMA註釋器。opennlp-morfologik-addon :Morfologik的插件opennlp-dl :使用onnxruntime依賴項為ONNX模型的OpenNLP接口實現。opennlp-dl-gpu :用onnxruntime_gpu依賴性替換onnxruntime以支持GPU加速度。opennlp-sandbox :在沙箱中發現了其他正在進行的項目您可以直接從Maven,SBT或Gradle導入核心工具包:
<dependency>
<groupId>org.apache.opennlp</groupId>
<artifactId>opennlp-tools</artifactId>
<version>${opennlp.version}</version>
</dependency>
libraryDependencies += "org.apache.opennlp" % "opennlp-tools" % "${opennlp.version}"
compile group: "org.apache.opennlp", name: "opennlp-tools", version: "${opennlp.version}"
有關更多詳細信息,請檢查我們的文檔
建造庫需要至少JDK 17和Maven 3.3.9。
克隆存儲庫後,進入目標目錄並運行:
mvn install
Apache OpenNLP項目是由志願者開發的,並且一直在尋找新的貢獻者來研究項目的所有部分。歡迎每一個貢獻,並且需要使它變得更好。貢獻可以是從小文檔錯字到新組件的任何內容。
如果您想參與,請在此處遵循指示