Библиотека Apache OpenLP - это инструментарий на основе машинного обучения для обработки текста естественного языка.
Этот инструментарий написан полностью в Java и обеспечивает поддержку общих задач NLP, таких как токенизация, сегментация предложений, часть речи, извлечение сущности, подготовка, анализ, резолюция Coreference, обнаружение языка и многое другое!
Эти задачи обычно требуются для создания более продвинутых услуг по обработке текстовой обработки.
Целью проекта OpenNLP является зрелый инструментарий для вышеупомянутых задач.
Дополнительной целью является предоставление большого количества предварительно созданных моделей для различных языков, а также аннотированные текстовые ресурсы, из которых эти модели получены.
В настоящее время OpenNLP включает в себя общие классификаторы, такие как максимальная энтропия, персептрон и наивные байесы.
OpenNLP может использоваться как программно через свой Java API, либо из терминала через его CLI. API OpenNLP можно легко подключить к распределенным потоковым конвейерам данных, таким как Apache Flink, Apache Nifi, Apache Spark.
Для получения дополнительной информации посетите домашнюю страницу OpenNLP
Вы можете использовать OpenNLP с любым языком, здесь предоставляются демонстрационные модели.
Модели полностью совместимы с последним выпуском, их можно использовать для тестирования или начала работы.
Примечание
Пожалуйста, тренируйте свои собственные модели для всех других вариантов использования.
Документация, включая Javadocs, использование кода и примеры интерфейса командной строки доступны здесь
Для недавних новостей, обновлений и тем, вы можете:
Пожалуйста, также проверьте вопросы и ответы сообщества.
В настоящее время в библиотеке есть разные пакеты:
opennlp-tools : основной инструментарий.opennlp-tools-models : набор классов для загрузки моделей OpenNLP с ClassPath.opennlp-uima : набор аннотаторов Apache UIMA.opennlp-morfologik-addon : аддон для Morfologikopennlp-dl : реализации интерфейса OpenNLP для моделей ONNX с использованием зависимости onnxruntime .opennlp-dl-gpu : заменяет onnxruntime на зависимость onnxruntime_gpu для поддержки ускорения графического процессора.opennlp-sandbox : Другие проекты, которые находятся в процессе, найдены в песочнице Вы можете импортировать основной инструментарий непосредственно из Maven, SBT или Gradle:
<dependency>
<groupId>org.apache.opennlp</groupId>
<artifactId>opennlp-tools</artifactId>
<version>${opennlp.version}</version>
</dependency>
libraryDependencies += "org.apache.opennlp" % "opennlp-tools" % "${opennlp.version}"
compile group: "org.apache.opennlp", name: "opennlp-tools", version: "${opennlp.version}"
Для получения более подробной информации, пожалуйста, проверьте нашу документацию
По крайней мере, JDK 17 и Maven 3.3.9 необходимы для создания библиотеки.
После клонирования хранилище перейдите в каталог назначения и запустите:
mvn install
Проект Apache OpenLP разрабатывается добровольцами и всегда ищет новых участников для работы над всеми частями проекта. Каждый вклад приветствуется и необходим, чтобы сделать его лучше. Вклад может быть чем угодно, от небольшой опечатки документации до нового компонента.
Если вы хотите принять участие, следуйте инструкциям здесь