Perpustakaan Apache OpenNLP adalah toolkit berbasis pembelajaran mesin untuk pemrosesan teks bahasa alami.
Toolkit ini ditulis sepenuhnya di Java dan memberikan dukungan untuk tugas-tugas NLP umum, seperti tokenisasi, segmentasi kalimat, penandaan sebagian dari speech, ekstraksi entitas bernama, chunking, penguraian, resolusi coreference, deteksi bahasa dan banyak lagi!
Tugas -tugas ini biasanya diperlukan untuk membangun layanan pemrosesan teks yang lebih canggih.
Tujuan dari proyek OpenNLP adalah menjadi toolkit yang matang untuk tugas -tugas yang disebutkan di atas.
Tujuan tambahan adalah untuk menyediakan sejumlah besar model pra-dibangun untuk berbagai bahasa, serta sumber daya teks beranotasi yang berasal dari model tersebut.
Saat ini, OpenNLP termasuk pengklasifikasi umum seperti entropi maksimum, perceptron dan Bayes naif.
OpenNLP dapat digunakan secara terprogram melalui Java API atau dari terminal melalui CLI -nya. API OpenNLP dapat dengan mudah dicolokkan ke dalam pipa data streaming terdistribusi seperti Apache Flink, Apache Nifi, Apache Spark.
Untuk informasi tambahan, kunjungi halaman rumah OpenNLP
Anda dapat menggunakan OpenNLP dengan bahasa apa pun, model demo disediakan di sini.
Model sepenuhnya kompatibel dengan rilis terbaru, mereka dapat digunakan untuk menguji atau memulai.
Catatan
Silakan latih model Anda sendiri untuk semua kasus penggunaan lainnya.
Dokumentasi, termasuk javadocs, penggunaan kode dan contoh antarmuka baris perintah tersedia di sini
Untuk berita terbaru, pembaruan, dan topik, Anda dapat:
Tolong, periksa juga pertanyaan dan jawaban OpenNLP komunitas.
Saat ini, perpustakaan memiliki paket yang berbeda:
opennlp-tools : The Core Toolkit.opennlp-tools-models : Satu set kelas untuk memuat model OpenNLP dari ClassPath.opennlp-uima : Satu set Annotator Apache Uima.opennlp-morfologik-addon : A Addon for Morfologikopennlp-dl : Implementasi antarmuka OpenNLP untuk model ONNX menggunakan ketergantungan onnxruntime .opennlp-dl-gpu : Mengganti onnxruntime dengan ketergantungan onnxruntime_gpu untuk mendukung akselerasi GPU.opennlp-sandbox : Proyek lain yang sedang berlangsung ditemukan di kotak pasir Anda dapat mengimpor toolkit inti langsung dari Maven, SBT atau Gradle:
<dependency>
<groupId>org.apache.opennlp</groupId>
<artifactId>opennlp-tools</artifactId>
<version>${opennlp.version}</version>
</dependency>
libraryDependencies += "org.apache.opennlp" % "opennlp-tools" % "${opennlp.version}"
compile group: "org.apache.opennlp", name: "opennlp-tools", version: "${opennlp.version}"
Untuk detail lebih lanjut silakan periksa dokumentasi kami
Setidaknya JDK 17 dan Maven 3.3.9 diharuskan membangun perpustakaan.
Setelah mengkloning repositori masuk ke direktori tujuan dan jalankan:
mvn install
Proyek Apache OpenNLP dikembangkan oleh sukarelawan dan selalu mencari kontributor baru untuk mengerjakan semua bagian proyek. Setiap kontribusi diterima dan diperlukan untuk membuatnya lebih baik. Kontribusi dapat berupa apa saja dari dokumentasi kecil kesalahan ketik hingga komponen baru.
Jika Anda ingin terlibat, silakan ikuti instruksi di sini