zemberek nlp
1.0.0
該項目現在處於緩慢的維護模式。
Zemberek-NLP為土耳其提供了自然語言處理工具。
最新版本為0.17.1(2019年7月23日)。更改日誌
請閱讀常見問題解答。
| 模塊 | Maven ID | |
|---|---|---|
| 核 | Zemberek-core | 特殊收藏,哈希功能和助手。 |
| 形態學 | Zemberek-Morphology | 土耳其形態分析,歧義和單詞產生。 |
| 令牌化 | Zemberek-Tokenization | 土耳其令牌化和句子邊界檢測。 |
| 正常化 | Zemberek差異化 | 基本咒語檢查器,單詞建議。嘈雜的文本歸一化。 |
| ner | Zemberek-ner | 土耳其名為“實體識別”。 |
| 分類 | Zemberek-classiency | 基於FastText項目的Java端口的文本分類。 |
| 語言標識 | Zemberek-lang-id | 快速識別文本語言。 |
| 語言建模 | Zemberek-lm | 提供語言模型壓縮算法。 |
| 申請 | Zemberek-Apps | 控制台應用 |
| GRPC服務器 | Zemberek-Grpc | GRPC服務器可從其他語言訪問。 |
| 例子 | Zemberek-審查 | 用法示例。 |
將此添加到pom.xml文件
< repositories >
< repository >
< id >zemberek-repo</ id >
< name >zemberek Maven Repo on Github</ name >
< url >https://raw.github.com/ahmetaa/maven-repo/master</ url >
</ repository >
</ repositories >和依賴項(例如形態學):
< dependencies >
< dependency >
< groupId >zemberek-nlp</ groupId >
< artifactId >zemberek-morphology</ artifactId >
< version >0.17.1</ version >
</ dependency >
</ dependencies >Google驅動器頁麵包含用於不同版本的JAR文件。
[ zemberek-full.jar ]是一個包含所有模塊和依賴項的單個罐子。當它直接運行時
java -jar zemberek-full.jar
它將列出可用的控制台應用程序。
這裡說明了有關如何編譯代碼並生成項目中的JAR文件的信息。
代碼中有一個示例模塊用於使用示例。
此外,還有一個單獨的項目,其中相同的示例使用Zemberek-nlp作為Maven模塊:土耳其-NLP-例例
請參閱問題部分以獲取更多問題,並隨時創建新問題。
代碼已在Apache許可證(版本2.0)下獲得許可
如果您在學術出版物中使用此項目,請參閱此網站。
請參閱contrutors.txt文件。