Stanford Corenlpは、Javaで書かれた一連の自然言語分析ツールを提供します。生の人間の言語テキスト入力を取り、基本形式の単語、スピーチの部分、企業、人の名前など、日付、時間、数量を正常化および解釈するかどうかにかかわらず、構文のフレーズまたは依存関係の観点から文の構造をマークアップし、同じエンティティを参照する名詞を示すことができます。もともとは英語用に開発されていましたが、現在では(現代の標準)アラビア語、(本土)中国語、フランス語、ドイツ語、ハンガリー語、イタリア語、スペイン語に対するさまざまなレベルのサポートも提供しています。 Stanford Corenlpは統合されたフレームワークであるため、多数の言語分析ツールをテキストに簡単に適用できます。プレーンテキストから始めて、2行のコードですべてのツールを実行できます。その分析は、高レベルおよびドメイン固有のテキスト理解アプリケーションの基礎ビルディングブロックを提供します。 Stanford Corenlpは、学界、産業、政府のさまざまなグループが広く使用している安定した、よくテストされた自然言語処理ツールのセットです。このツールは、ルールベースの確率的機械学習、およびディープラーニングコンポーネントをさまざまに使用しています。
Stanford CorenlpコードはJavaで記述され、GNU General Public License(V2以降)に基づいてライセンスされています。これは完全なGPLであり、他の人に配布する独自のソフトウェアでは使用できませんが、多くの無料使用を可能にします。
年に数回、安定したコミットに対応する新しいバージョンのソフトウェアを配布します。
リリースの間に、コードの開発バージョンの最新バージョンをいつでも使用できます。
最新のコードを使用するための有用な指示を次に示します。
ここで最新バージョンのコードを備えた更新された瓶を提供する場合があります。
現在、コードの現在のリリースバージョンは最新のJARですが、GitHub Headの最新のHeadをいつでも作成できます。
cd CoreNLP ; antcd CoreNLP/classes ; jar -cf ../stanford-corenlp.jar edumvn packageで実行する場合、テストを実行してこのJARファイルを作成する必要があります: CoreNLP/target/stanford-corenlp-4.5.4.jarstanford-corenlp-models-current.jarをインストールするには、 -Dclassifier=modelsを設定する必要があります。スペイン語のサンプルコマンドは次のとおりです。mvn mvn install:install-file -Dfile=/location/of/stanford-spanish-corenlp-models-current.jar -DgroupId=edu.stanford.nlp -DartifactId=stanford-corenlp -Dversion=4.5.4 -Dclassifier=models-spanish -Dpackaging=jar 最新のコードに対応するモデルジャーは、下の表にあります。
Shift-Reduce ParserやWikidictのように、より大きな(英語)モデルの一部は、デフォルトのモデルJARで分布していません。これらには、英語(エクストラ)と英語(KBP)ジャーをダウンロードする必要があります。他の言語のリソースには、対応するモデルJARの使用が必要です。
モデルを取得する最良の方法は、git-lfsを使用して、フェイスハブを抱きしめることからそれらをクローンすることです。
たとえば、フランスのモデルを取得するには、次のコマンドを実行します。
# Make sure you have git-lfs installed
# (https://git-lfs.github.com/)
git lfs install
git clone https://huggingface.co/stanfordnlp/corenlp-french
JARは、下のリンクまたはハグするフェイスハブページから直接ダウンロードできます。
| 言語 | モデルジャー | 最後に更新されました |
|---|---|---|
| アラビア語 | ダウンロード(HFハブ) | 4.5.6 |
| 中国語 | ダウンロード(HFハブ) | 4.5.6 |
| 英語(エクストラ) | ダウンロード(HFハブ) | 4.5.6 |
| 英語(KBP) | ダウンロード(HFハブ) | 4.5.6 |
| フランス語 | ダウンロード(HFハブ) | 4.5.6 |
| ドイツ語 | ダウンロード(HFハブ) | 4.5.6 |
| ハンガリー | ダウンロード(HFハブ) | 4.5.6 |
| イタリア語 | ダウンロード(HFハブ) | 4.5.6 |
| スペイン語 | ダウンロード(HFハブ) | 4.5.6 |
私たちのホスティングを手伝ってくれた顔を抱きしめてくれてありがとう!
Gradle自体がわからない場合は、公式サイトをご覧ください:https://gradle.org
Maven Centralによると、build.gradleで以下を書きます。
dependencies {
implementation ' edu.stanford.nlp:stanford-corenlp:4.5.5 '
}英語を分析したい場合は、次を追加します。
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english-kbp "別のバージョンを使用する場合は、「4.5.5」を使用するバージョンに置き換えます。
Maven CentralでStanford Corenlpのリリースを見つけることができます。
Stanford Corenlpのホームページで詳細とドキュメントを見つけることができます。
Stanford Corenlpへの貢献についての詳細については、ファイルContributing.mdを参照してください。
CorenLPに関する質問は、Stanford-NLPタグを使用してStackOverFlowに投稿するか、メーリングリストに投稿できます。