Este projeto está agora no modo de manutenção lenta.
O Zemberek-NLP fornece ferramentas de processamento de linguagem natural para turco.
A versão mais recente é 0.17.1 (23 de julho de 2019). Alterar log
Leia as perguntas frequentes para obter perguntas comuns.
| Módulo | MAVEN ID | |
|---|---|---|
| Essencial | Zemberek-core | Coleções especiais, funções de hash e ajudantes. |
| Morfologia | Zemberek-Morphology | Análise morfológica turca, desambiguação e geração de palavras. |
| Tokenização | Zemberek-tokenização | Tokenização turca e detecção de limites da frase. |
| Normalização | Normalização de Zemberek | Verificador ortográfico básico, sugestão de palavras. Normalização do texto barulhento. |
| Ner | Zemberek-ir | Reconhecimento de entidade nomeado turco. |
| Classificação | Zemberek-Classification | Classificação de texto com base no projeto Java Port of FastText. |
| Identificação do idioma | Zemberek-Lang-Id | Identificação rápida da linguagem de texto. |
| Modelagem de idiomas | Zemberek-lm | Fornece um algoritmo de compactação de modelos de idiomas. |
| Aplicações | Zemberek-Apps | Aplicações de console |
| servidor GRPC | Zemberek-grpc | Servidor GRPC para acesso de outros idiomas. |
| Exemplos | Exemplos de Zemberek | Exemplos de uso. |
Adicione isso ao arquivo pom.xml
< repositories >
< repository >
< id >zemberek-repo</ id >
< name >zemberek Maven Repo on Github</ name >
< url >https://raw.github.com/ahmetaa/maven-repo/master</ url >
</ repository >
</ repositories >E dependências (por exemplo, morfologia):
< dependencies >
< dependency >
< groupId >zemberek-nlp</ groupId >
< artifactId >zemberek-morphology</ artifactId >
< version >0.17.1</ version >
</ dependency >
</ dependencies >A página do Google Drive contém arquivos JAR para versões diferentes.
[ Zemberek-full.jar ] é um único frasco que contém todos os módulos e dependências. Quando é executado diretamente com
java -jar zemberek-full.jar
Ele listará aplicativos de console disponíveis.
Aqui, são explicadas informações sobre como compilar o código e gerar arquivos JAR do projeto.
Há um módulo de exemplos no código para exemplos de uso.
Além disso, existe um projeto separado com os mesmos exemplos que usam Zemberek-NLP como os módulos Maven: Turkish-NLP-Exemples
Consulte a seção de problemas para obter mais problemas e sinta -se à vontade para criar novos.
O código está licenciado sob licença Apache, versão 2.0
Se você usar este projeto em uma publicação acadêmica, consulte este site.
Consulte o arquivo colaboradores.txt.