โครงการนี้อยู่ในโหมดการบำรุงรักษาช้า
Zemberek-NLP เป็นเครื่องมือในการประมวลผลภาษาธรรมชาติสำหรับตุรกี
เวอร์ชันล่าสุดคือ 0.17.1 (23 กรกฎาคม 2019) เปลี่ยนบันทึก
โปรดอ่านคำถามที่พบบ่อยสำหรับคำถามทั่วไป
| โมดูล | maven id | |
|---|---|---|
| แกนกลาง | zemberek-core | คอลเลกชันพิเศษฟังก์ชั่นแฮชและผู้ช่วย |
| สัณฐานวิทยา | zemberek-morphology | การวิเคราะห์ทางสัณฐานวิทยาของตุรกีการสร้างความไม่พอใจและการสร้างคำ |
| การทำให้โทเค็น | เซมเบเร็ก | โทเค็นตุรกีและการตรวจจับขอบเขตประโยค |
| การทำให้เป็นมาตรฐาน | Zemberek-normalization | ตัวตรวจสอบการสะกดพื้นฐานคำแนะนำคำ การทำให้เป็นปกติของข้อความที่มีเสียงดัง |
| คนโง่ | zemberek-ner | การรับรู้เอนทิตีของตุรกี |
| การจำแนกประเภท | การจำแนกประเภท Zemberek | การจำแนกประเภทข้อความตามพอร์ต Java ของโครงการ FastText |
| การระบุภาษา | Zemberek-Lang-id | การระบุภาษาข้อความอย่างรวดเร็ว |
| การสร้างแบบจำลองภาษา | Zemberek-LM | ให้อัลกอริทึมการบีบอัดแบบจำลองภาษา |
| แอปพลิเคชัน | แอพ Zemberek-Apps | แอปพลิเคชันคอนโซล |
| เซิร์ฟเวอร์ GRPC | Zemberek-GRPC | เซิร์ฟเวอร์ GRPC สำหรับการเข้าถึงจากภาษาอื่น ๆ |
| ตัวอย่าง | ตัวอย่างของ Zemberek | ตัวอย่างการใช้งาน |
เพิ่มสิ่งนี้ลงในไฟล์ pom.xml
< repositories >
< repository >
< id >zemberek-repo</ id >
< name >zemberek Maven Repo on Github</ name >
< url >https://raw.github.com/ahmetaa/maven-repo/master</ url >
</ repository >
</ repositories >และการพึ่งพา (เช่นสัณฐานวิทยา):
< dependencies >
< dependency >
< groupId >zemberek-nlp</ groupId >
< artifactId >zemberek-morphology</ artifactId >
< version >0.17.1</ version >
</ dependency >
</ dependencies >หน้า Google ไดรฟ์มีไฟล์ JAR สำหรับเวอร์ชันที่แตกต่างกัน
[ Zemberek-full.jar ] เป็นขวดเดียวที่มีโมดูลและการพึ่งพาทั้งหมด เมื่อมันทำงานโดยตรงด้วย
java -jar zemberek-full.jar
มันจะแสดงรายการแอปพลิเคชันคอนโซลที่มีอยู่
ที่นี่ข้อมูลเกี่ยวกับวิธีการรวบรวมรหัสและสร้างไฟล์ JAR จากโครงการ
มีโมดูลตัวอย่างในรหัสสำหรับตัวอย่างการใช้งาน
นอกจากนี้ยังมีโครงการแยกต่างหากที่มีตัวอย่างเดียวกับที่ใช้ Zemberek-NLP เป็นโมดูล Maven: Turkish-NLP-Examples
โปรดดูส่วนปัญหาสำหรับปัญหาเพิ่มเติมและอย่าลังเลที่จะสร้างปัญหาใหม่
รหัสได้รับอนุญาตภายใต้ใบอนุญาต Apache เวอร์ชัน 2.0
หากคุณใช้โครงการนี้ในสิ่งพิมพ์ทางวิชาการโปรดดูที่เว็บไซต์นี้
โปรดดูไฟล์ txt.txt