Lexnlp от Lexpredict
Поиск информации и извлечение для реального, неструктурированного юридического текста
LEXNLP - это библиотека для работы с реальным, неструктурированным юридическим текстом, включая контракты, планы, политики, процедуры и другие материалы.
LEXNLP предоставляет функциональность, такую как:
- Сегментация и токенизация, такие как
- Анализатор предложения, который знает об общих законных сокращениях, таких как LLC. или F.3d.
- Предварительно обученные модели сегментации для юридических концепций, таких как страницы или разделы.
- Предварительно обученное встроение слов и тематические модели, в целом и для конкретных областей практики
- Предварительно обученные классификаторы для типа документов и типа пункта
- Широкий спектр извлечения фактов, например:
- Денежные суммы, немелетные суммы, проценты, соотношения
- Условные утверждения и ограничения, такие как «меньше» или «позже»
- Даты, повторяющиеся даты и продолжительность
- Суды, правила и цитаты
- Инструменты для создания новых методов кластеризации и классификации
- Сотни модульных тестов из реальных юридических документов
Информация
- ContraxSuite: https://contraxsuite.com/
- Lexpredict: https://lexpredict.com/
- Официальный веб -сайт: https://lexnlp.com/
- Документация: http://lexpredict-lexnlp.readthedocs.io/en/latest/ (в процессе)
- Контакт: [email protected]
Структура
- Веб-приложение ContraxSuite: https://github.com/lexpredict/lexpredict-contraxsuite
- Библиотека LEXNLP для извлечения: https://github.com/lexpredict/lexpredict-lexnlp
- ContraxSuite Предварительно обученные модели и «наборы знаний»: https://github.com/lexpredict/lexpredict-legal-dictionary
- ContraxSuite Приборы соглашения: https://github.com/lexpredict/lexpredict-contraxsuite-samples
- Автоматизация развертывания ContraxSuite: https://github.com/lexpredict/lexpredict-contraxsuite-deploy Обратите внимание, что установки ContraxSuite обычно требуют обученных моделей или наборов знаний для использования.
Лицензирование
LEXNLP доступен под двойной лицензионной моделью. По умолчанию эта библиотека может использоваться в условиях AGPLV3, как подробно описано в файле лицензии репозитория; Тем не менее, организации могут запросить релиз с условий AGPL или лицензии на оценку без GPL, связавшись с лицензированием ContraxSuite по адресу <[email protected]>.
Требования
Выпуски
- 2.3.0: 30 ноября 2022 г. - двадцать шестой запланированное публичное освобождение; код
- 2.2.1.0: 10 августа 2022 г. - двадцать пятое запланированное публичное освобождение; код
- 2.2.0: 7 июля 2022 г. - двадцать четвертое запланированное публичное публикацию; код
- 2.1.0: 16 сентября 2021 г. - двадцать третья запланированная публичная публикация; код
- 2.0.0: 10 мая 2021 г. - двадцать второго запланированного публичного выпуска; код
- 1.8.0: 2 декабря 2020 г. - двадцать первого запланированного публичного выпуска; код
- 1.7.0: 27 августа 2020 г. - двадцатый запланированный публичный выпуск; код
- 1.6.0: 27 мая 2020 года - девятнадцатый запланированный публичный выпуск; код
- 1.4.0: 20 декабря 2019 г. - восемнадцатое запланированное публичное освобождение; код
- 1.3.0: 1 ноября 2019 г. - Семнадцатое запланированное публичное освобождение; код
- 0.2.7: 1 августа 2019 г. - шестнадцатый запланированный публичный релиз; код
- 0.2.6: 12 июня 2019 г. - пятнадцатый запланированный публичный релиз; код
- 0.2.5: 1 марта 2019 г. - четырнадцатый запланированный публичный релиз; код
- 0.2.4: 1 февраля 2019 - Тринадцатый запланированный публичный выпуск; код
- 0.2.3: 10 июня 2019 - двенадцатый запланированный публичный релиз; код
- 0.2.2: 30 сентября 2018 г. - Одиннадцатый запланированный публичный релиз; код
- 0.2.1: 24 августа 2018 г. - десятый запланированный публичный релиз; код
- 0.2.0: 1 августа 2018 г. - девятый запланированный публичный релиз; код
- 0,1,9: 1 июля 2018 г. - девятый запланированный публичный релиз; код
- 0,1,8: 1 мая 2018 года - восьмое запланированное публичное освобождение; код
- 0,1,7: 1 апреля 2018 г. - седьмое запланированное публичное освобождение; код
- 0,1,6: 1 марта 2018 г. - шестой запланированный публичный релиз; код
- 0,1,5: 1 февраля 2018 г. - пятый запланированный публичный релиз; код
- 0,1,4: 1 января 2018 г. - четвертый запланированный публичный релиз; код
- 0,1,3: 1 декабря 2017 г. - третий запланированный публичный релиз; код
- 0,1,2: 1 ноября 2017 г. - второй запланированный публичный релиз; код
- 0,1,1: 2 октября 2017 г. - выпуск исправления ошибок для 0,1,0; код
- 0,1,0: 30 сентября 2017 г. - первый публичный релиз; код