Ce projet est maintenant en mode de maintenance lente.
Zemberek-NLP fournit des outils de traitement du langage naturel pour le turc.
La dernière version est de 0,17.1 (23 juillet 2019). Modifier le journal
Veuillez lire la FAQ pour des questions communes.
| Module | Id maven | |
|---|---|---|
| Cœur | zemberek-core | Collections spéciales, fonctions de hachage et assistants. |
| Morphologie | Zemberek-Morphologie | Analyse morphologique turque, désambiguïsation et génération de mots. |
| Tokenisation | zemberek-tokenisation | Tokenisation turque et détection des limites des phrases. |
| Normalisation | zemberek-normalisation | Vérificateur orthographique de base, suggestion de mots. Normalisation du texte bruyant. |
| Nervure | zemberek-ner | La reconnaissance de l'entité nommée turque. |
| Classification | classification Zemberek | Classification de texte basée sur le port Java du projet FastText. |
| Identification du langage | Zemberek-Lang-ID | Identification rapide de la langue du texte. |
| Modélisation des langues | zemberek-lm | Fournit un algorithme de compression de modèle de langue. |
| Applications | Zemberek-Apps | Applications de console |
| serveur GRPC | zemberek-grpc | Serveur GRPC pour l'accès à partir d'autres langues. |
| Exemples | Zemberek-Examples | Exemples d'utilisation. |
Ajoutez ceci au fichier pom.xml
< repositories >
< repository >
< id >zemberek-repo</ id >
< name >zemberek Maven Repo on Github</ name >
< url >https://raw.github.com/ahmetaa/maven-repo/master</ url >
</ repository >
</ repositories >Et dépendances (par exemple la morphologie):
< dependencies >
< dependency >
< groupId >zemberek-nlp</ groupId >
< artifactId >zemberek-morphology</ artifactId >
< version >0.17.1</ version >
</ dependency >
</ dependencies >La page Google Drive contient des fichiers JAR pour différentes versions.
[ Zemberek-Full.jar ] est un seul pot qui contient tous les modules et dépendances. Quand il est exécuté directement avec
java -jar zemberek-full.jar
Il répertoriera les applications de console disponibles.
Ici, des informations sur la façon de compiler le code et de générer des fichiers JAR à partir du projet sont expliquées.
Il existe un module d'exemples dans le code pour les exemples d'utilisation.
Il existe également un projet distinct avec les mêmes exemples qui utilisent Zemberek-NLP comme modules Maven: Turkish-NLP-Examples
Veuillez consulter la section des problèmes pour d'autres problèmes et n'hésitez pas à en créer de nouveaux.
Le code est sous licence Apache, version 2.0
Si vous utilisez ce projet dans une publication académique, veuillez vous référer à ce site.
Veuillez vous référer au fichier contributeurs.txt.