Stanford Corenlp bietet eine Reihe von in Java geschriebenen Tools für natürliche Sprachanalyse. Es kann rohes rohes Texte -Input annehmen und den Basisformen von Wörtern, ihren Teilen der Sprache, ob sie Namen von Unternehmen, Menschen usw. sind, Normalisierung und Interpretation von Daten, Zeiten und numerischen Größen geben, die Struktur von Sätzen in Bezug auf syntaktische Phrasen oder Abhängigkeiten angeben, und die Nomen -Phrasen auf dieselben Entitäten beziehen. Es wurde ursprünglich für Englisch entwickelt, bietet aber jetzt auch unterschiedliche Unterstützung für (modernes Standard) Arabisch, (Festland) Chinesisch, Französisch, Deutsch, Ungarisch, Italienisch und Spanisch. Stanford Corenlp ist ein integriertes Framework, mit dem es sehr einfach ist, eine Reihe von Sprachanalyse -Tools auf ein Textstück anzuwenden. Ausgehend von einfachem Text können Sie alle Tools mit nur zwei Codezeilen ausführen. Die Analysen bieten die grundlegenden Bausteine für höhere und domänenspezifische Textverständnisanwendungen. Stanford Corenlp ist eine Reihe von stabilen und gut getesteten Tools für die Verarbeitung natürlicher Sprache, die von verschiedenen Gruppen in der Wissenschaft, Industrie und Regierung häufig verwendet werden. Die Tools verwenden verschiedene regelbasierte, probabilistische maschinelle Lernen und Deep-Lern-Komponenten.
Der Stanford Corenlp -Code ist in Java geschrieben und unter der GNU General Public Lizenz (v2 oder höher) lizenziert. Beachten Sie, dass dies die vollständige GPL ist, die viele freie Verwendungszwecke ermöglicht, jedoch nicht die Verwendung in proprietärer Software, die Sie an andere verteilen.
Mehrmals im Jahr verteilen wir eine neue Version der Software, die einem stabilen Commit entspricht.
Während der Zeit zwischen den Veröffentlichungen kann man immer die neueste, in der Entwicklungsversion unseres Code verwendete Version verwenden.
Hier sind einige hilfreiche Anweisungen, um den neuesten Code zu verwenden:
Manchmal stellen wir hier aktualisierte JARs zur Verfügung, die die neueste Version des Codes haben.
Derzeit ist die aktuelle veröffentlichte Version des Codes unser jüngster veröffentlichtes JAR, obwohl Sie immer das neueste von Github Head selbst erstellen können.
cd CoreNLP ; antcd CoreNLP/classes ; jar -cf ../stanford-corenlp.jar edumvn package ausführen, sollten Sie die Tests ausführen und diese JAR-Datei erstellen: CoreNLP/target/stanford-corenlp-4.5.4.jarstanford-corenlp-models-current.jar Sie müssen -Dclassifier=models festlegen. Hier ist der Beispielbefehl für Spanisch: mvn install:install-file -Dfile=/location/of/stanford-spanish-corenlp-models-current.jar -DgroupId=edu.stanford.nlp -DartifactId=stanford-corenlp -Dversion=4.5.4 -Dclassifier=models-spanish -Dpackaging=jar Die Modelle Gläser, die dem neuesten Code entsprechen, finden Sie in der folgenden Tabelle.
Einige der größeren (englischen) Modelle-wie der Shift-Reduce-Parser und Wikidict-sind nicht mit unseren Standardmodellen verteilt. Diese erfordern das Herunterladen der Englisch- (Extra-) und englischen Gläser (KBP). Ressourcen für andere Sprachen erfordern die Verwendung der entsprechenden Modelle.
Der beste Weg, um die Modelle zu erhalten, besteht darin, GIT-LFS zu verwenden und sie vom Umarmungs-Face-Hub zu klonen.
Führen Sie beispielsweise die folgenden Befehle aus, um die französischen Modelle zu erhalten:
# Make sure you have git-lfs installed
# (https://git-lfs.github.com/)
git lfs install
git clone https://huggingface.co/stanfordnlp/corenlp-french
Die Gläser können direkt von den Links unten oder der Seite mit umarmenden Gesichtsknotenpunkte heruntergeladen werden.
| Sprache | Modellglas | Zuletzt aktualisiert |
|---|---|---|
| Arabisch | Download (HF Hub) | 4.5.6 |
| chinesisch | Download (HF Hub) | 4.5.6 |
| Englisch (extra) | Download (HF Hub) | 4.5.6 |
| Englisch (KBP) | Download (HF Hub) | 4.5.6 |
| Französisch | Download (HF Hub) | 4.5.6 |
| Deutsch | Download (HF Hub) | 4.5.6 |
| ungarisch | Download (HF Hub) | 4.5.6 |
| Italienisch | Download (HF Hub) | 4.5.6 |
| Spanisch | Download (HF Hub) | 4.5.6 |
Vielen Dank an das Umarmen für das Gesicht, das bei unserem Hosting geholfen hat!
Wenn Sie Gradle selbst nicht kennen, siehe offizielle Website: https://gradle.org
Schreiben Sie Folgendes in Ihren Build.gradle nach Maven Central:
dependencies {
implementation ' edu.stanford.nlp:stanford-corenlp:4.5.5 '
}Wenn Sie Englisch analysieren möchten, fügen Sie die folgende hinzu:
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english-kbp "Wenn Sie eine andere Version verwenden, ersetzen Sie "4.5.5" in einer von Ihnen verwendeten Version.
Auf Maven Central finden Sie Veröffentlichungen von Stanford Corenlp.
Weitere Erläuterungen und Dokumentationen auf der Stanford CoreLP -Homepage finden Sie.
Informationen über die Bereitstellung von Beiträgen zum Stanford CoreLP finden Sie in der Datei beitragen.md.
Fragen zu Corenlp können entweder mit dem Tag Stanford-NLP auf Stackoverflow oder auf den Mailinglisten veröffentlicht werden.