opennlp
OpenNLP 2.5.1
Apache OpenNLP库是一种基于机器学习的工具包,用于处理自然语言文本。
该工具包完全写在Java中,并为常见的NLP任务提供了支持,例如令牌化,句子分割,言论部分标记,命名实体提取,分解,解析,核心分辨率分辨率,语言检测等等!
通常需要这些任务来构建更高级的文本处理服务。
OpenNLP项目的目标是成为上述任务的成熟工具包。
另一个目标是为各种语言提供大量的预制模型,以及这些模型的带注释的文本资源。
目前,OpenNLP包括常见的分类器,例如最大熵,感知器和天真的贝叶斯。
可以通过其Java API或通过其CLI从终端进行编程方式使用OpenNLP。可以轻松地将OpenNLP API插入分布式流数据管道中,例如Apache Flink,Apache Nifi,Apache Spark。
有关其他信息,请访问OpenNLP主页
您可以使用任何语言使用OpenNLP,此处提供了演示模型。
这些模型与最新版本完全兼容,它们可用于测试或入门。
笔记
请为所有其他用例训练自己的型号。
文档,包括javadocs,代码使用和命令行界面示例此处可用
对于最近的新闻,更新和主题,您可以:
请检查社区的OpenNLP问题和答案。
目前,图书馆有不同的软件包:
opennlp-tools :核心工具包。opennlp-tools-models :一组从类Pather加载OpenNLP模型的类。opennlp-uima :一组Apache UIMA注释器。opennlp-morfologik-addon :Morfologik的插件opennlp-dl :使用onnxruntime依赖项为ONNX模型的OpenNLP接口实现。opennlp-dl-gpu :用onnxruntime_gpu依赖性替换onnxruntime以支持GPU加速度。opennlp-sandbox :在沙箱中发现了其他正在进行的项目您可以直接从Maven,SBT或Gradle导入核心工具包:
<dependency>
<groupId>org.apache.opennlp</groupId>
<artifactId>opennlp-tools</artifactId>
<version>${opennlp.version}</version>
</dependency>
libraryDependencies += "org.apache.opennlp" % "opennlp-tools" % "${opennlp.version}"
compile group: "org.apache.opennlp", name: "opennlp-tools", version: "${opennlp.version}"
有关更多详细信息,请检查我们的文档
建造库需要至少JDK 17和Maven 3.3.9。
克隆存储库后,进入目标目录并运行:
mvn install
Apache OpenNLP项目是由志愿者开发的,并且一直在寻找新的贡献者来研究项目的所有部分。欢迎每一个贡献,并且需要使它变得更好。贡献可以是从小文档错字到新组件的任何内容。
如果您想参与,请在此处遵循指示