斯坦福·科倫普(Stanford Corenlp)提供了一組用Java編寫的自然語言分析工具。它可以採用原始的人類語言文本輸入,並給出單詞的基本形式,它們的語音部分,無論是公司,人的名稱等,正常化和解釋日期,時間和數字數量,以句法短語或依賴關係或依賴關係來標記句子的結構,並指出哪些名詞短語是指同一實體。它最初是為英語開發的,但現在還提供了對(現代標準)阿拉伯語,(大陸)中文,法語,德語,匈牙利語,意大利語和西班牙語的不同水平。斯坦福·科倫普(Stanford Corenlp)是一個集成的框架,這使得在文本上應用大量語言分析工具變得非常容易。從純文本開始,您只需兩行代碼即可運行所有工具。它的分析為高級和特定領域的文本理解應用程序提供了基礎構建塊。 Stanford Corenlp是一組穩定且經過充分測試的自然語言處理工具,該工具被學術界,工業和政府各個團體廣泛使用。這些工具使用基於規則的,概率的機器學習和深度學習組件。
Stanford Corenlp代碼用Java編寫,並根據GNU通用公共許可證(V2或更高版本)獲得許可。請注意,這是完整的GPL,它允許許多免費用途,但不能在您分配給他人的專有軟件中使用。
一年幾次我們分發了該軟件的新版本,這與穩定的提交相對應。
在兩次版本之間,人們始終可以在我們的代碼的開發版本下使用最新的版本。
以下是一些使用最新代碼的有用說明:
有時,我們將在此處提供更新的罐子,其中具有最新版本的代碼。
目前,該代碼的當前發布版本是我們最新發布的JAR,儘管您總是可以自己構建Github Head的最新版本。
cd CoreNLP ; antcd CoreNLP/classes ; jar -cf ../stanford-corenlp.jar edumvn package中運行此命令,則應運行測試並構建此JAR文件: CoreNLP/target/stanford-corenlp-4.5.4.jarstanford-corenlp-models-current.jar您需要設置-Dclassifier=models 。這是西班牙語的示例命令: mvn install:install-file -Dfile=/location/of/stanford-spanish-corenlp-models-current.jar -DgroupId=edu.stanford.nlp -DartifactId=stanford-corenlp -Dversion=4.5.4 -Dclassifier=models-spanish -Dpackaging=jar 與最新代碼相對應的模型罐可以在下表中找到。
一些較大的(英語)模型(例如Shift-Reduce Parser和Wikidict)並未與我們的默認模型jar分發。這些需要下載英語(額外)和英語(KBP)罐子。其他語言的資源需要使用相應的模型jar。
獲取模型的最好方法是使用git-lfs並從擁抱臉部集線器中克隆它們。
例如,要獲取法式模型,請運行以下命令:
# Make sure you have git-lfs installed
# (https://git-lfs.github.com/)
git lfs install
git clone https://huggingface.co/stanfordnlp/corenlp-french
罐子可以直接從下面的鏈接或擁抱式樞紐頁面下載。
| 語言 | 模型罐 | 最後更新 |
|---|---|---|
| 阿拉伯 | 下載(HF集線器) | 4.5.6 |
| 中國人 | 下載(HF集線器) | 4.5.6 |
| 英語(額外) | 下載(HF集線器) | 4.5.6 |
| 英語(KBP) | 下載(HF集線器) | 4.5.6 |
| 法語 | 下載(HF集線器) | 4.5.6 |
| 德語 | 下載(HF集線器) | 4.5.6 |
| 匈牙利 | 下載(HF集線器) | 4.5.6 |
| 意大利人 | 下載(HF集線器) | 4.5.6 |
| 西班牙語 | 下載(HF集線器) | 4.5.6 |
感謝您擁抱臉的幫助!
如果您不知道Gradle本身,請參閱官方網站:https://gradle.org
根據Maven Central將以下內容寫入您的build.gradle:
dependencies {
implementation ' edu.stanford.nlp:stanford-corenlp:4.5.5 '
}如果要分析英語,請添加以下方式:
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english-kbp "如果使用另一個版本,請將“ 4.5.5”替換為您使用的版本。
您可以在Maven Central上找到Stanford Corenlp的版本。
您可以在Stanford Corenlp主頁上找到更多的解釋和文檔。
有關向Stanford Corenlp做出貢獻的信息,請參見文件貢獻。
有關Corenlp的問題可以通過標籤Stanford-NLP或郵件列表發佈在Stackoverflow上。