Die Apache OpenNLP -Bibliothek ist ein maschinelles Lernbasis für die Verarbeitung natürlicher Sprachtext.
Dieses Toolkit ist vollständig in Java geschrieben und bietet Unterstützung für gemeinsame NLP-Aufgaben wie Tokenisierung, Satzsegmentierung, Speech-Tagging, genannte Entitätsextraktion, Chunking, Parsen, Koreferenzauflösung, Spracherkennung und mehr!
Diese Aufgaben sind in der Regel erforderlich, um fortschrittlichere Textverarbeitungsdienste zu erstellen.
Ziel des OpenNLP -Projekts ist es, ein ausgereiftes Toolkit für die oben genannten Aufgaben zu sein.
Ein zusätzliches Ziel ist es, eine große Anzahl vorgefertigter Modelle für eine Vielzahl von Sprachen sowie die kommentierten Textressourcen zu liefern, aus denen diese Modelle abgeleitet sind.
Derzeit umfasst OpenNLP gemeinsame Klassifizierer wie maximale Entropie, Perzeptron und naive Bayes.
OpenNLP kann sowohl programmgesteuert über seine Java -API als auch von einem Terminal durch seine CLI verwendet werden. OpenNLP -API kann einfach in verteilte Streaming -Datenpipelines wie Apache Flink, Apache NIFI, Apache Spark angeschlossen werden.
Weitere Informationen finden Sie auf der OpenNLP -Startseite
Sie können OpenNLP mit jeder Sprache verwenden, Demo -Modelle werden hier bereitgestellt.
Die Modelle sind mit der neuesten Version vollständig kompatibel und können zum Testen oder zum Einstieg verwendet werden.
Notiz
Bitte trainieren Sie Ihre eigenen Modelle für alle anderen Anwendungsfälle.
Dokumentation, einschließlich Javadocs, Code-Nutzung und Beispiele für Befehlszeilen-Schnittstellen, finden Sie hier
Für aktuelle Nachrichten, Updates und Themen können Sie:
Bitte überprüfen Sie auch die offenen Fragen und Antworten der Community.
Derzeit hat die Bibliothek unterschiedliche Pakete:
opennlp-tools : Das Kern-Toolkit.opennlp-tools-models : Eine Reihe von Klassen zum Laden von OpenNLP-Modellen aus dem Klassenpfad.opennlp-uima : Eine Reihe von Apache-UIMA-Annotatoren.opennlp-morfologik-addon : Ein Addon für Morfologikopennlp-dl : Implementierungen für OpenNLP-Schnittstellen für ONNX-Modelle unter Verwendung der onnxruntime Abhängigkeit.opennlp-dl-gpu : Ersetzt onnxruntime durch die Abhängigkeit onnxruntime_gpu , um die GPU-Beschleunigung zu unterstützen.opennlp-sandbox : Andere Projekte finden Sie in der Sandbox Sie können das Kern -Toolkit direkt von Maven, SBT oder Gradle importieren:
<dependency>
<groupId>org.apache.opennlp</groupId>
<artifactId>opennlp-tools</artifactId>
<version>${opennlp.version}</version>
</dependency>
libraryDependencies += "org.apache.opennlp" % "opennlp-tools" % "${opennlp.version}"
compile group: "org.apache.opennlp", name: "opennlp-tools", version: "${opennlp.version}"
Weitere Informationen finden Sie in unserer Dokumentation
Mindestens JDK 17 und Maven 3.3.9 müssen die Bibliothek erstellen.
Nach dem Klonen des Repositorys gehen Sie in das Zielverzeichnis und führen Sie aus:
mvn install
Das Apache OpenNLP -Projekt wurde von Freiwilligen entwickelt und sucht immer nach neuen Mitwirkenden, um an allen Teilen des Projekts zu arbeiten. Jeder Beitrag ist willkommen und benötigt, um es besser zu machen. Ein Beitrag kann alles von einem kleinen Dokumentations -Tippfehler in eine neue Komponente sein.
Wenn Sie sich engagieren möchten, befolgen Sie bitte die Anweisungen hier