Proyek ini sekarang dalam mode pemeliharaan yang lambat.
Zemberek-NLP menyediakan alat pemrosesan bahasa alami untuk Turki.
Versi terbaru adalah 0,17,1 (23 Juli 2019). Ubah log
Harap baca FAQ untuk pertanyaan umum.
| Modul | ID MAVEN | |
|---|---|---|
| Inti | Zemberek-core | Koleksi Khusus, Fungsi Hash dan Pembantu. |
| Morfologi | Zemberek-Morfologi | Analisis Morfologi Turki, Disambiguasi dan Generasi Kata. |
| Tokenisasi | Zemberek-Tokenisasi | Tokenisasi Turki dan Deteksi Batas Kalimat. |
| Normalisasi | Zemberek-Normalisasi | Pemeriksa mantra dasar, saran kata. Normalisasi teks yang bising. |
| Ner | zemberek-ner | Pengakuan entitas bernama Turki. |
| Klasifikasi | Klasifikasi Zemberek | Klasifikasi Teks Berdasarkan Proyek Port Java dari FastText. |
| Identifikasi Bahasa | Zemberek-lang-id | Identifikasi Bahasa Teks Cepat. |
| Pemodelan Bahasa | zemberek-lm | Memberikan algoritma kompresi model bahasa. |
| Aplikasi | Zemberek-Apps | Aplikasi konsol |
| Server GRPC | Zemberek-grpc | Server GRPC untuk akses dari bahasa lain. |
| Contoh | contoh-contoh zemberek | Contoh penggunaan. |
Tambahkan ini ke file pom.xml
< repositories >
< repository >
< id >zemberek-repo</ id >
< name >zemberek Maven Repo on Github</ name >
< url >https://raw.github.com/ahmetaa/maven-repo/master</ url >
</ repository >
</ repositories >Dan dependensi (misalnya morfologi):
< dependencies >
< dependency >
< groupId >zemberek-nlp</ groupId >
< artifactId >zemberek-morphology</ artifactId >
< version >0.17.1</ version >
</ dependency >
</ dependencies >Halaman Google Drive berisi file JAR untuk versi yang berbeda.
[ Zemberek-full.jar ] adalah toples tunggal yang berisi semua modul dan dependensi. Saat dijalankan langsung dengan
java -jar zemberek-full.jar
Ini akan mencantumkan aplikasi konsol yang tersedia.
Di sini informasi tentang cara mengkompilasi kode dan menghasilkan file jar dari proyek dijelaskan.
Ada modul contoh dalam kode untuk contoh penggunaan.
Juga, ada proyek terpisah dengan contoh yang sama yang menggunakan zemberek-NLP sebagai modul Maven: Turki-NLP-Examples
Silakan lihat bagian masalah untuk masalah lebih lanjut dan jangan ragu untuk membuat yang baru.
Kode dilisensikan di bawah Lisensi Apache, Versi 2.0
Jika Anda menggunakan proyek ini dalam publikasi akademik, silakan merujuk ke situs ini.
Silakan merujuk ke file kontributor.txt.