zemberek nlp
1.0.0
该项目现在处于缓慢的维护模式。
Zemberek-NLP为土耳其提供了自然语言处理工具。
最新版本为0.17.1(2019年7月23日)。更改日志
请阅读常见问题解答。
| 模块 | Maven ID | |
|---|---|---|
| 核 | Zemberek-core | 特殊收藏,哈希功能和助手。 |
| 形态学 | Zemberek-Morphology | 土耳其形态分析,歧义和单词产生。 |
| 令牌化 | Zemberek-Tokenization | 土耳其令牌化和句子边界检测。 |
| 正常化 | Zemberek差异化 | 基本咒语检查器,单词建议。嘈杂的文本归一化。 |
| ner | Zemberek-ner | 土耳其名为“实体识别”。 |
| 分类 | Zemberek-classiency | 基于FastText项目的Java端口的文本分类。 |
| 语言标识 | Zemberek-lang-id | 快速识别文本语言。 |
| 语言建模 | Zemberek-lm | 提供语言模型压缩算法。 |
| 申请 | Zemberek-Apps | 控制台应用 |
| GRPC服务器 | Zemberek-Grpc | GRPC服务器可从其他语言访问。 |
| 例子 | Zemberek-审查 | 用法示例。 |
将此添加到pom.xml文件
< repositories >
< repository >
< id >zemberek-repo</ id >
< name >zemberek Maven Repo on Github</ name >
< url >https://raw.github.com/ahmetaa/maven-repo/master</ url >
</ repository >
</ repositories >和依赖项(例如形态学):
< dependencies >
< dependency >
< groupId >zemberek-nlp</ groupId >
< artifactId >zemberek-morphology</ artifactId >
< version >0.17.1</ version >
</ dependency >
</ dependencies >Google驱动器页面包含用于不同版本的JAR文件。
[ zemberek-full.jar ]是一个包含所有模块和依赖项的单个罐子。当它直接运行时
java -jar zemberek-full.jar
它将列出可用的控制台应用程序。
这里说明了有关如何编译代码并生成项目中的JAR文件的信息。
代码中有一个示例模块用于使用示例。
此外,还有一个单独的项目,其中相同的示例使用Zemberek-nlp作为Maven模块:土耳其-NLP-例例
请参阅问题部分以获取更多问题,并随时创建新问题。
代码已在Apache许可证(版本2.0)下获得许可
如果您在学术出版物中使用此项目,请参阅此网站。
请参阅contrutors.txt文件。