Этот проект сейчас находится в режиме медленного обслуживания.
Zemberek-NLP предоставляет инструменты обработки естественного языка для Турции.
Последняя версия - 0,17,1 (23 июля 2019 г.). Изменить журнал
Пожалуйста, прочитайте FAQ по общим вопросам.
| Модуль | Maven id | |
|---|---|---|
| Основной | Zemberek-Core | Специальные коллекции, хэш -функции и помощники. |
| Морфология | Zemberek-Morphology | Турецкий морфологический анализ, устранение неоднозначности и генерация слов. |
| Токенизация | Zemberek-Tokenization | Турецкая токенизация и обнаружение границ предложения. |
| Нормализация | Zemberek-нормализация | Основная проверка орфографии, слово предложение. Шумная нормализация текста. |
| Нор | Zemberek-ner | Турецкий назван признание сущности. |
| Классификация | Zemberek-Classiation | Текстовая классификация на основе Java Port of Fasttext Project. |
| Идентификация языка | Zemberek-Lang-ID | Быстрая идентификация текстового языка. |
| Языковое моделирование | Zemberek-lm | Обеспечивает алгоритм сжатия языка. |
| Приложения | Zemberek-Apps | Приложения консоли |
| сервер GRPC | Zemberek-grpc | Сервер GRPC для доступа с других языков. |
| Примеры | Zemberek-Examples | Примеры использования. |
Добавить это в файл pom.xml
< repositories >
< repository >
< id >zemberek-repo</ id >
< name >zemberek Maven Repo on Github</ name >
< url >https://raw.github.com/ahmetaa/maven-repo/master</ url >
</ repository >
</ repositories >И зависимости (например, морфология):
< dependencies >
< dependency >
< groupId >zemberek-nlp</ groupId >
< artifactId >zemberek-morphology</ artifactId >
< version >0.17.1</ version >
</ dependency >
</ dependencies >Страница Google Drive содержит файлы JAR для разных версий.
[ Zemberek-full.jar ]-это одна банка, которая содержит все модули и зависимости. Когда он запускается напрямую с
java -jar zemberek-full.jar
Он будет перечислять доступные приложения консоли.
Здесь объяснена информация о том, как скомпилировать код и генерировать файлы JAR из проекта.
В коде есть модуль примеров для примеров использования.
Кроме того, существует отдельный проект с теми же примерами, в котором используется Zemberek-NLP, что и модули Maven: Turkish-NLP-примеры
Пожалуйста, смотрите раздел «Проблемы» для дальнейших проблем и не стесняйтесь создавать новые.
Код лицензирован по лицензии Apache, версия 2.0
Если вы используете этот проект в академической публикации, пожалуйста, обратитесь к этому сайту.
Пожалуйста, обратитесь к файлу Antormors.txt.