Аналитика юридического текста
Список выбранных ресурсов, методов и инструментов, посвященных юридическим текстовым аналитике.

Пожалуйста, прочитайте руководящие принципы взноса, прежде чем внести свой вклад. Пожалуйста, добавьте ресурс, подняв запрос на привлечение. Мы также стремимся к обсуждению и предложению новых идей (включая дополнительные разделы контента) в качестве вопросов.
Содержимое
- Выбранные задачи и варианты использования
- Методы
- Библиотеки
- Наборы данных и данные
- Большие языковые модели и GPT
- Схемы аннотаций и данных
- Аннотация Инструменты
- Программное обеспечение (интерфейсы)
- Исследовательские группы и лаборатории
- Учебные пособия
Выбранные задачи и варианты использования
Вернуться к вершине
- Оптическое распознавание символов (найти здесь больше информации)
- Предварительная обработка юридического документа (найти больше информации здесь)
- Сегментация пункта и обнаружение границ предложения
- Извлечение информации и распознавание объектов (найти больше информации здесь)
- Классификация юридической нормы
- Машинный перевод
- Сравнение документов и семантическое соответствие
- Текстовое суммирование
- Аргумент добыча
- Ответ на вопрос
- Прогнозирование исходов летательных дел
- Юридический и регулирующий мониторинг
- Прогнозирование юридической критичности
- Поколение суда
- Ссылка и извлечение основной работы
- Сборка документов и генерация
- Голос транскрипция
- Обнаружение аномалии
- Анонимизация данных
- Проверка последовательности
- Обработка естественного языка в юридической области
Методы
Вернуться к вершине
- Прогресс НЛП
- Текстовые визуализации
- Оптическое распознавание персонажа
- Методы на основе правил для NLP, Apache Ruta, Jape Grammar
- Статистический NLP
- Машинное обучение структуры
- Нейронные сети и глубокое обучение для учебника NLP
- Адаптация домена (например, исследовательская работа)
Библиотеки
Вернуться к вершине
- Spacy - Промышленная промышленная обработка естественного языка
- Scikit - машинное обучение в Python
- Nltk - инструментарий естественного языка
- Apache Uima
- Ворота - Общая архитектура для текстовой инженерии
- Обнимающееся лицо - более 1000 предварительно обученных моделей трансформатора/встраивания
- Немецкая модель Bert: Deepset AI
- FLAIR - SOTA NLP (включая биомедицинские и юридические данные)
- Блэкстоун - юридическое название признание и категоризатор текста
- Обнаружение юридической ссылки - поиск NEO
- Обнаружение юридической ссылки - открытые юридические данные
- Хэндс - Трансформеры в масштабе для ответа на вопросы и нейронного поиска
- Обнаружение границ приговора (US Caselaw)
- Количественные юридические исследования
- Citeurl - расширяемый инструмент для обнаружения и гиперссылки юридических цитат
- LEXNLP - Библиотека NLP Python для легальной текстовой аналитики
- Голландский прецедентный экстрактор - функции для получения опубликованных данных о прецедентном праве Голландского (Rechtspraak) и доступных метаданных, связанных с делами
- Исследователь прецедентного права - Материалы для создания программной платформы для анализа сети для анализа решений в голландском и европейском суде
Наборы данных и данные
Вернуться к вершине
- Наборы данных NLP
- Набор данных с разнообразным текстом на 800 ГБ для языкового моделирования
- Meta Search: поиск набора данных Google
- Openlegaldata
- ИК-специальные оценки ранжирования, наборы данных и т. Д.
- Бельгия: бельгийский набор данных о поиске статутных статей (BSARD), включая код
- Потрясающий немецкий НЛП
- Немецкий набор данных для получения юридической информации (Гердалир)
- Юридическое признание
- Юридическое текстовое обобщение
- Перевод юридического текста
- Классификация юридических документов
- Классификация юридического приговора (немецкий)
- 100 тыс. Немецких судебных решений
- Наборы данных юридических бумаг
- LexGlue: контрольный набор данных для юридического языка понимания на английском языке
- Lextreme: многоязычный и многозадачный эталон для юридического домена
- Multilegalpile: многоязычный юридический корпус 689 ГБ
- MultilegalsBD: многоязычный набор данных по определению границ юридического предложения
- Multilegalneg
- Потрясающие юридические данные
- Германия: Gesetze im Internet, Rechtsprechung im Internet, verwaltungsvorschriften im internet
- Германия: аннотированные судебные решения (стиль суждения)
- Германия: набор данных по федеральным судам Германии
- Германия: количественный набор данных слушаний суда убежища в немецких административных судах. Asyfair
- Германия: Ответ на юридические вопросы от мирян в немецкой системе гражданского права: данные и кодекс. EACL Paper 2024
- Германия: обнаружение пустого положения в немецкой стандартной форме потребительских контрактов
- Германия: Aktenzeichen der Bundesrepublik Deutschland (AZ-BRD)
- Германия: Corpus des Deutschen Bundesrechts (C-DBR)
- Германия: Корпус Деншейдунген де Бундесверфассунгсгерихтс (CE-Bverfg)
- Германия: корпус der amtlichen entscheidungssammlung des bundesverfassungsgerichts (c-bverfge)
- Германия: Corona-Rechtsprechung des Bundesverfassungsgerichts (Bverfg-Corona)
- Германия: Корпус Деншейдунген Дес Бундесвервальтунгсгерихтс (CE-BVERWG)
- Германия: Корпус Деншейдунген Дес Бундесарбейтсрихты (CE-BAG)
- Германия: Корпус Деншейдунген Дес Бундессатентинггерихты (CE-BPATG)
- Германия: Корпус Деншейдунген Дес Бундесжерихтсхофс (CE-BGH)
- Германия: президенты и вице-президенты Федеральных судов Германии (Pvp-FCG)
- Германия: Stoppwörter der Deutschen Rechtssprache (SW-DE-RS)
- Франция: набор данных структуры решений французского суда - FCD12K
- Швейцария: швейцарский законодательный корпус Французский и немецкий
- Швейцария: швейцарский федеральный набор данных Верховного суда (SCD)
- Швейцария: прогноз суждения швейцарского суда
- Швейцария: швейцарское суждение прогноз xL
- Швейцария: швейцарское прогноз критичности
- Швейцария: прогноз юридической зоны швейцарской
- Швейцария: швейцарские ведущие решения
- Швейцария: швейцарское законодательство
- Швейцария: швейцарские решения
- Швейцария: швейцарское ведущее решение о решении
- Швейцария: извлечение швейцарской цитирования
- Швейцария: швейцарское судно.
- Швейцария: швейцарский док2doc Информационный поиск
- Турция: прогнозирование результатов в высших судах Турции
- Индия: Индийские юридические документы Корпус для предсказания суда и объяснения
- ECTHR: Судебные решения Европейского суда по правам человека
- ECTHR: LACOUR!: Обеспечение исследования аргументации на слушаниях Европейского суда по правам человека
- ECTHR: аргумент горнодобывающий корпус
- Закон ЕС (Eurlex R Package), Цифровое корпус Европейского парламента (DCEP)
- Показ информации о соответствии нормативно -правовой информации в ЕС
- ЕС Lextreme
- Израиль: база данных Верховного суда Израиля
- Канада: федеральные законы и правила (FTP://205.193.86.89/)
- Великобритания: отчеты по закону Великобритании и поиск прецедентного права
- Великобритания: Кембриджский юридический корпус
- Австралия: Открытое австралийское юридическое корпус - первый и единственный мультиджурисдикционный открытый корпус австралийских законодательных и судебных документов
- Набор данных об интерпретации закона США
- Набор данных об обнаружении границ предложения в США
- US CASELAW Функциональный набор данных о конкретном сегментации
- Обнаружение полярности приговора США
- Проект доступа к США
- Федеральный Caselaw США через CourtListener Recap с помощью проекта Free.law включает API
- База данных Верховного суда США
- Палата представителей США Управление по пересмотру закона
- Набор данных и кода апелляции по апелляциям (BVA) апелляции по апелляциям (BVA)
- Обзор наборов данных политологии: Poldata
- Международное право: текст торговых соглашений (TOTA)
- Международное право: Корпус решений: Международный суд юстиции (CD-ICJ)
- Международное право: корпус решений: Постоянный суд международного правосудия (CD-PCIJ)
- Организация Объединенных Наций: Генеральный дебат Организации Объединенных Наций, Корпус Организации Объединенных Наций Параллельный корпус
- Набор данных Atticus по пониманию Atticus по проекту Atticus: корпус более чем 13 000 лейблов в 510 коммерческих юридических контрактах с богатыми экспертными аннотациями.
- Набор данных KIRA Systems M & A от Kira Systems: некоммерческий набор данных, содержащий 4400 документов и ярлыков для 50 юридических концепций в настройке надлежащей осмотрительности слияний и поглощений.
- Индия: набор данных ILSI для идентификации юридического закона
- Индия: набор данных для семантической сегментации / риторической маркировки ролей
- Индия: суммирование с несколькими наборами данных
- Индия: Buildnyai
- Европейское патентное управление - EP Полнотекстовые данные для текстовой аналитики
- Google Патенты на публичные наборы данных: подключение общественных, оплачиваемых и частных патентных данных
- Всемирная патентная информация (WPI) - Документы технические области из основных патентных органов
- Корпус транскрипта геноцида (GTC)
Большие языковые модели и GPT
Вернуться к вершине
- См. Выделенный репозиторий на крупных языковых моделях (LLMS) и генеративных предварительно обученных трансформаторах (GPT) для юридических
- CHATGPT на OpenAI: примеры, документация, цена, точная настройка CHATGPT
- Эскиз, обобщающий ЧАТГПТ
- Большие языковые модели: отчет Ки Бундесвербанд
- Большие языковые модели: обнимание лица отчета
- Отчет об ограничениях CHATGPT
- GPT сдает экзамен
- Юридические языковые модели
Схемы аннотаций и данных
Вернуться к вершине
- Руководящие принципы аннотации для признания юридических лиц (Германия)
- Семантические типы юридических норм
- Руководящие принципы аннотации для обнаружения границ приговора в Caselaw (США)
- Руководящие принципы аннотации для значения предложения в установленном законом интерпретации (США)
- Сали: современные стандарты правовой промышленности
Аннотация Инструменты
Вернуться к вершине
- Потрясающая аннотация данных
- Вундеркинд
- Доккано
- Костюм
Программное обеспечение (интерфейсы)
Вернуться к вершине
- Исследование прецедентного права - программная платформа для анализа сетевого анализа для анализа решений голландского и европейского суда - Руководство пользователя
- Электронная база данных по инвестиционным договорам (редактирование)
- GraphDoc - удобный графический интерфейс, который позволяет строить деревья решений - кодовая база
- GESP - Загрузите все общедоступные решения немецких судов прямо из вашего терминала
Исследовательские группы, лаборатории и сообщества
Вернуться к вершине
- Стэнфордский университет - Кодекс: Стэнфордский центр юридической неформатики
- Технический университет Мюнхена
- Технический университет Мюнхена - юридическая техническая группа
- Центр Bucerius по юридической профессии
- Юридическая школа Саффолка - Лаборатория юридических инноваций и технологий (LIT)
- Университет Оттавы - лаборатория юридических технологий
- Венский университет - факультет инноваций и цифровизации в области права
- Амстердамский университет - Центр права Лейбниза
- Университет Хельсинки - Legaltech Research Lab
- Университет Хофстра - Лаборатория исследований логики и технологий, логика и технологий
- Вычислительные юридические исследования
- Cirsfid-AI-Университет Болонья
- Iaail - Международная ассоциация по искусственному интеллекту и права
- ASAIL - автоматическое обнаружение, извлечение и анализ семантической информации в юридических текстах
- Семинар по обработке естественного правового языка: документы, модели, наборы данных и связанные с ним события
- Китайский ИИ и Закон (Кейл)
- Университет Копенгагена, Icourts, Центр передового опыта Датского Национального исследовательского фонда для международных судов
- Маастрихт юридическая и техническая лаборатория
Учебные пособия
Вернуться к вершине
- Обезьяна обучение - анализ текста
- Использование NLP для понимания законов
- Представление документов для юридических текстов
- Наука данных для юристов - учебные ресурсы
- Кодирование для адвокатов (прекращено)
- Пользовательские подходы НЛП к анонимизации данных
- Извлечение информации в юридических документах
- Легальный NLP: классификация предложений и объясняемый ИИ
- Юридический Глоссарий ИИ
- Законодательный учебный центр
Кредиты
Вернуться к вершине
Большое спасибо нашим участникам и многим другим.
Эта работа лицензирована по международной лицензии Creative Commons Attribution-Sharealike 4.0.