斯坦福·科伦普(Stanford Corenlp)提供了一组用Java编写的自然语言分析工具。它可以采用原始的人类语言文本输入,并给出单词的基本形式,它们的语音部分,无论是公司,人的名称等,正常化和解释日期,时间和数字数量,以句法短语或依赖关系或依赖关系来标记句子的结构,并指出哪些名词短语是指同一实体。它最初是为英语开发的,但现在还提供了对(现代标准)阿拉伯语,(大陆)中文,法语,德语,匈牙利语,意大利语和西班牙语的不同水平。斯坦福·科伦普(Stanford Corenlp)是一个集成的框架,这使得在文本上应用大量语言分析工具变得非常容易。从纯文本开始,您只需两行代码即可运行所有工具。它的分析为高级和特定领域的文本理解应用程序提供了基础构建块。 Stanford Corenlp是一组稳定且经过充分测试的自然语言处理工具,该工具被学术界,工业和政府各个团体广泛使用。这些工具使用基于规则的,概率的机器学习和深度学习组件。
Stanford Corenlp代码用Java编写,并根据GNU通用公共许可证(V2或更高版本)获得许可。请注意,这是完整的GPL,它允许许多免费用途,但不能在您分配给他人的专有软件中使用。
一年几次我们分发了该软件的新版本,这与稳定的提交相对应。
在两次版本之间,人们始终可以在我们的代码的开发版本下使用最新的版本。
以下是一些使用最新代码的有用说明:
有时,我们将在此处提供更新的罐子,其中具有最新版本的代码。
目前,该代码的当前发布版本是我们最新发布的JAR,尽管您总是可以自己构建Github Head的最新版本。
cd CoreNLP ; antcd CoreNLP/classes ; jar -cf ../stanford-corenlp.jar edumvn package中运行此命令,则应运行测试并构建此JAR文件: CoreNLP/target/stanford-corenlp-4.5.4.jarstanford-corenlp-models-current.jar您需要设置-Dclassifier=models 。这是西班牙语的示例命令: mvn install:install-file -Dfile=/location/of/stanford-spanish-corenlp-models-current.jar -DgroupId=edu.stanford.nlp -DartifactId=stanford-corenlp -Dversion=4.5.4 -Dclassifier=models-spanish -Dpackaging=jar 与最新代码相对应的模型罐可以在下表中找到。
一些较大的(英语)模型(例如Shift-Reduce Parser和Wikidict)并未与我们的默认模型jar分发。这些需要下载英语(额外)和英语(KBP)罐子。其他语言的资源需要使用相应的模型jar。
获取模型的最好方法是使用git-lfs并从拥抱脸部集线器中克隆它们。
例如,要获取法式模型,请运行以下命令:
# Make sure you have git-lfs installed
# (https://git-lfs.github.com/)
git lfs install
git clone https://huggingface.co/stanfordnlp/corenlp-french
罐子可以直接从下面的链接或拥抱式枢纽页面下载。
| 语言 | 模型罐 | 最后更新 |
|---|---|---|
| 阿拉伯 | 下载(HF集线器) | 4.5.6 |
| 中国人 | 下载(HF集线器) | 4.5.6 |
| 英语(额外) | 下载(HF集线器) | 4.5.6 |
| 英语(KBP) | 下载(HF集线器) | 4.5.6 |
| 法语 | 下载(HF集线器) | 4.5.6 |
| 德语 | 下载(HF集线器) | 4.5.6 |
| 匈牙利 | 下载(HF集线器) | 4.5.6 |
| 意大利人 | 下载(HF集线器) | 4.5.6 |
| 西班牙语 | 下载(HF集线器) | 4.5.6 |
感谢您拥抱脸的帮助!
如果您不知道Gradle本身,请参阅官方网站:https://gradle.org
根据Maven Central将以下内容写入您的build.gradle:
dependencies {
implementation ' edu.stanford.nlp:stanford-corenlp:4.5.5 '
}如果要分析英语,请添加以下方式:
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english-kbp "如果使用另一个版本,请将“ 4.5.5”替换为您使用的版本。
您可以在Maven Central上找到Stanford Corenlp的版本。
您可以在Stanford Corenlp主页上找到更多的解释和文档。
有关向Stanford Corenlp做出贡献的信息,请参见文件贡献。
有关Corenlp的问题可以通过标签Stanford-NLP或邮件列表发布在Stackoverflow上。