Este proyecto ahora está en modo de mantenimiento lento.
Zemberek-NLP proporciona herramientas de procesamiento del lenguaje natural para turco.
La última versión es 0.17.1 (23 de julio de 2019). Registro de cambio
Lea las preguntas frecuentes para obtener preguntas comunes.
| Módulo | ID de maven | |
|---|---|---|
| Centro | zemberek-core | Colecciones especiales, funciones hash y ayudantes. |
| Morfología | zemberek-morfología | Análisis morfológico turco, desambiguación y generación de palabras. |
| Tokenización | zemberek-tokenización | Tokenización turca y detección de límites de oración. |
| Normalización | Zemberek-Normalización | Correctora de ortografía básica, sugerencia de palabras. Normalización de texto ruidoso. |
| Ner | zemberek -ner | Turquía nombrada reconocimiento de entidad. |
| Clasificación | Zemberek-classificación | Clasificación de texto basada en el puerto Java del proyecto FastText. |
| Identificación del idioma | zemberek-lang-id | Identificación rápida del lenguaje de texto. |
| Modelado de idiomas | zemberek-lm | Proporciona un algoritmo de compresión del modelo de idioma. |
| Aplicaciones | zemberek-apps | Aplicaciones de consola |
| servidor GRPC | zemberek-Grpc | servidor GRPC para acceder desde otros idiomas. |
| Ejemplos | Zemberek-Examples | Ejemplos de uso. |
Agregue esto al archivo pom.xml
< repositories >
< repository >
< id >zemberek-repo</ id >
< name >zemberek Maven Repo on Github</ name >
< url >https://raw.github.com/ahmetaa/maven-repo/master</ url >
</ repository >
</ repositories >Y dependencias (por ejemplo, morfología):
< dependencies >
< dependency >
< groupId >zemberek-nlp</ groupId >
< artifactId >zemberek-morphology</ artifactId >
< version >0.17.1</ version >
</ dependency >
</ dependencies >La página de Google Drive contiene archivos JAR para diferentes versiones.
[ Zemberek-full.jar ] es un solo frasco que contiene todos los módulos y dependencias. Cuando se ejecuta directamente con
java -jar zemberek-full.jar
Enumerará las aplicaciones de consola disponibles.
Aquí se explica la información sobre cómo compilar el código y generar archivos JAR del proyecto.
Hay un módulo de ejemplos en el código para ejemplos de uso.
Además, hay un proyecto separado con los mismos ejemplos que usa Zemberek-NLP como módulos Maven: Ejemplos de Turkish-NLP
Consulte la sección de problemas para obtener más problemas y no dude en crear otros nuevos.
El código tiene licencia bajo la licencia Apache, versión 2.0
Si usa este proyecto en una publicación académica, consulte este sitio.
Consulte el archivo contribuyente.txt.