Analyse de texte juridique
Une liste de ressources, de méthodes et d'outils sélectionnés dédiés à l'analyse juridique de texte.

Veuillez lire les directives de contribution avant de contribuer. Veuillez ajouter une ressource en augmentant une demande de traction. Nous recherchons également une discussion et une proposition de nouvelles idées (y compris des sections de contenu supplémentaires) comme problèmes.
Contenu
- Tâches et cas d'utilisation sélectionnés
- Méthodes
- Bibliothèques
- Ensembles de données et données
- Modèles de grande langue et GPT
- Annotation et schémas de données
- Outils d'annotation
- Logiciel (interfaces)
- Groupes de recherche et laboratoires
- Tutoriels
Tâches et cas d'utilisation sélectionnés
Retour en haut
- Reconnaissance optique des caractères (trouver plus d'informations ici)
- Pré-traitement des documents juridiques (trouvez plus d'informations ici)
- Segmentation des clauses et détection des limites des phrases
- Extraction d'informations et reconnaissance des entités nommées (trouvez plus d'informations ici)
- Classification des normes juridiques
- Traduction automatique
- Comparaison des documents et correspondance sémantique
- Résumé de texte
- Exploitation d'arguments
- Question Répondre
- Prédiction des résultats des affaires juridiques
- Surveillance juridique et réglementaire
- Prédiction de criticité juridique
- Génération du tribunal
- Extraction de référence et de coreférence
- Document Assemblage et génération
- Transcription vocale
- Détection d'anomalie
- Anonymisation des données
- Vérification de la cohérence
- Traitement du langage naturel dans le domaine juridique
Méthodes
Retour en haut
- Progrès de la PNL
- Visualisations de texte
- Reconnaissance de caractère optique
- Méthodes basées sur des règles pour la PNL, Apache Ruta, Jape Grammar
- PNL statistique
- Cadres d'apprentissage automatique
- Réseaux de neurones et tutoriel d'apprentissage en profondeur pour la PNL
- Adaptation du domaine (par exemple, document de recherche)
Bibliothèques
Retour en haut
- Spacy - Traitement du langage naturel à résistance industrielle
- Scikit - Apprentissage automatique à Python
- NLTK - boîte à outils en langue naturelle
- Apache Uima
- Gate - Architecture générale pour l'ingénierie du texte
- Face étreinte - plus de 1000 modèles de transformateur / intégration pré-formés pour le domaine juridique
- Modèle de bert allemand: AI en profondeur
- FLAIR - SOTA NLP (incl. Données biomédicales et juridiques)
- Blackstone - Catégoriseur de reconnaissance et de texte entités légales nommées
- Détection de référence juridique - Recherche de NEO
- Détection de référence juridique - données légales ouvertes
- BACK DE HAYS - Transformers à grande échelle pour la réponse aux questions et la recherche neuronale
- Détection des limites de la phrase (US Caselaw)
- Études juridiques quantitatives
- Citeurl - Un outil extensible pour détecter et hyperlienant les citations légales
- LEXNLP - Python NLP Library for Legal Text Analytics
- Extracteur de jurisprudence néerlandaise - Fonctions pour obtenir des données publiées sur la judiciaire néerlandaise (RECHTSPRAAK) et les métadonnées disponibles associées aux affaires
- Explorateur de jurisprudence - Matériel pour la création d'une plate-forme logicielle d'analyse de réseau pour analyser les décisions néerlandaises et de la Cour européenne
Ensembles de données et données
Retour en haut
- Ensembles de données NLP
- Un ensemble de données de 800 Go de texte diversifié pour la modélisation du langage
- Meta Search: Google Dataset Search
- OpenLegaldata
- Benchmarks de classement ad hoc IR, ensembles de données de formation, etc.
- Belgique: ensemble de données de récupération d'articles statutaires belges (BSARD), y compris le code
- Super PNL allemand
- Ensemble de données allemand pour la recherche d'informations juridiques (Gerdalir)
- Reconnaissance de l'entité juridique
- Résumé de texte juridique
- Traduction de texte juridique
- Classification des documents juridiques
- Classification des phrases légales (allemand)
- 100K décisions de la cour allemande
- Ensembles de données de papier juridique
- Lexglue: un ensemble de données de référence pour la compréhension de la langue juridique en anglais
- Lextreme: une référence multi-lingues et multi-tâches pour le domaine juridique
- Multilegalpile: un corpus juridique multilingue de 689 Go
- MultilegalsBD: un ensemble de données de détection des limites de phrase juridique multilingue
- Multilegalneg
- Données juridiques impressionnantes
- Allemagne: GESETZE IM Internet, rechtsprechung im Internet, verwaltungsvorschriften im Internet
- Allemagne: Décisions judiciaires annotées (style de jugement)
- Allemagne: ensemble de données fédérales allemands
- Allemagne: ensemble de données quantitatives des audiences des tribunaux d'asile aux tribunaux administratifs allemands. Asyfair
- Allemagne: Répondre aux questions juridiques des profanes du système de droit civil allemand: données et code. EACL PAPER 2024
- Allemagne: détecter les clauses de vide dans les contrats de consommation de forme standard allemand
- Allemagne: Aktenzeichen der Bundesrepublik Deutschland (AZ-BRD)
- Allemagne: Corpus des Deutschen Bundesrechts (C-DBR)
- Allemagne: Corpus der Entscheidungen des Bundesverfassungsgerichts (ce-bverfg)
- Allemagne: Corpus der Amtlichen Entscheidungsamlung des Bundesverfassungsgerichts (c-bverfge)
- Allemagne: Corona-Rechtsprechung des Bundesverfassungsgerichts (bverfg-corona)
- Allemagne: Corpus der Entscheidungen des Bundesverwaltungsgerichts (ce-bverwg)
- Allemagne: Corpus der Entscheidungen des Bundesarbeitsgerichts (CE-Bag)
- Allemagne: Corpus der Entscheidungen des Bunspatentgerichts (ce-bpatg)
- Allemagne: Corpus der Entscheidungen des Bundesgerichtshofs (ce-bgh)
- Allemagne: présidents et vice-présidents des tribunaux fédéraux d'Allemagne (PVP-FCG)
- Allemagne: stoppwörter der deutschen rechtssprache (sw-de-rs)
- France: l'ensemble de données de la structure de la Cour de la Cour française - FCD12K
- Suisse: Législation suisse Corpus français et allemand
- Suisse: ensemble de données de la Cour suprême de la Cour suprême (SCD) suisse
- Suisse: prédiction du jugement suisse
- Suisse: prédiction du jugement suisse xl
- Suisse: prédiction de la criticité suisse
- Suisse: Prédiction de la zone de la loi suisse
- Suisse: décisions de direction suisses
- Suisse: législation suisse
- Suisse: décisions suisses
- Suisse: Résumé de la décision de la direction suisse
- Suisse: extraction de citation suisse
- Suisse: génération de vue de la cour suisse
- Suisse: Swiss Doc2Doc Information Retrieval
- Turquie: prédiction des résultats dans les cours supérieures de la Turquie
- Inde: Documents juridiques indiens Corpus pour la prédiction et l'explication du jugement judiciaire
- ECTH: décisions judiciaires de la Cour européenne des droits de l'homme
- ECTH: Lacour !: Permettre des recherches sur l'argumentation dans les audiences de la Cour européenne des droits de l'homme
- ECTH: Corpus d'extraction d'arguments
- Droit de l'UE (package Eurlex R), corpus numérique du Parlement européen (DCEP)
- Récupération des informations sur la conformité réglementaire de l'UE
- Lextreme de l'UE
- Israël: la base de données de la Cour suprême israélienne
- Canada: Lois et réglementations fédérales (FTP://205.193.86.89/)
- Royaume-Uni: Rapports de droit britannique et recherche de jurisprudence
- Royaume-Uni: Cambridge Law Corpus
- Australie: Open Australian Legal Corpus - Le premier et le seul corpus ouvert multijuridictionnel de documents législatifs et judiciaires australiens
- Ensemble de données d'interprétation du droit statutaire américain
- Ensemble de données de détection des limites de la phrase de la phrase US CASELAW
- US CASELAW fonctionnel et émet un ensemble de données de segmentation spécifique
- Détection de polarité de la phrase de caslaw américaine
- Projet d'accès américain US CASELAW
- US Federal Caselaw via CourtListener Recap du projet Free.law, comprend une API
- Base de données de la Cour suprême des États-Unis
- Office de la Chambre des représentants des États-Unis du droit avocat de la révision du droit
- L'ensemble de données et le code de la prédiction de la prédiction de citation de l'appel des anciens combattants (BVA)
- Aperçu des ensembles de données des sciences politiques: Poldata
- Droit international: texte des accords commerciaux (TOTA)
- Droit international: Corpus des décisions: Cour internationale de justice (CD-ICJ)
- Droit international: Corpus des décisions: Cour permanente de justice internationale (CD-PCIJ)
- Nations Unies: Corpus de débat général des Nations Unies, Corpus parallèle des Nations Unies
- Contrat Comprendre le jeu de données Atticus par le projet Atticus: un corpus de 13 000 étiquettes dans 510 contrats juridiques commerciaux avec de riches annotations d'experts.
- Kira Systems M&A DataSet By Kira Systems: Un ensemble de données à usage non commercial comprenant 4 400 documents et étiquettes pour 50 concepts juridiques dans le réglage de la diligence raisonnable des fusions et acquisitions.
- Inde: ensemble de données ILSI pour l'identification des statuts juridiques
- Inde: ensemble de données pour la segmentation sémantique / étiquetage des rôle rhétoriques
- Inde: Résumé avec plusieurs ensembles de données
- Inde: Buildnyai
- Office des brevets européens - Données de texte intégral EP pour l'analyse de texte
- Google brevets Public DataSets: Connexion des données publiques, payantes et privées
- Informations sur les brevets mondiaux (WPI) - Documents les domaines techniques des principales autorités de brevet
- Corpus de transcription du génocide (GTC)
Modèles de grande langue et GPT
Retour en haut
- Voir le référentiel dédié sur les modèles de grande langue (LLM) et les transformateurs génératifs pré-formés (GPT) pour
- Chatgpt à Openai: Exemples, documentation, prix, affectation du Chatgpt
- Croquis résumant le chatppt
- Modèles de grande langue: Rapport par Ki Bundesverband
- Modèles de grande langue: Rapport de visage étreint
- Rapport sur les limitations de Chatgpt
- GPT passe l'examen du barreau
- Modèles de langue juridique
Annotation et schémas de données
Retour en haut
- Lignes directrices d'annotation pour la reconnaissance des entités juridiques (Allemagne)
- Types sémantiques de normes juridiques
- Lignes directrices d'annotation pour la détection des limites des phrases dans Caselaw (États-Unis)
- Lignes directrices d'annotation pour la valeur de la phrase dans l'interprétation statutaire (États-Unis)
- Sali: Normes modernes de l'industrie juridique
Outils d'annotation
Retour en haut
- Annotation de données impressionnante
- Prodige
- Doccano
- Gosse
Logiciel (interfaces)
Retour en haut
- Explorateur de jurisprudence - Plateforme logicielle d'analyse de réseau pour analyser les décisions néerlandaises et de la Cour européenne - Guide de l'utilisateur
- Base de données électronique sur les traités d'investissement (modifier)
- GraphDoc - Interface graphique conviviale qui permet de construire des arbres de décision - CodeBase
- GESP - Téléchargez toutes les décisions du tribunal allemand accessibles au public directement à partir de votre terminal
Groupes de recherche, laboratoires et communautés
Retour en haut
- Université de Stanford - Codex: le Stanford Center for Legal Informatics
- Université technique de Munich
- Université technique de Munich - Groupe de technologies juridiques
- Bucerius Center sur la profession juridique
- École de droit du Suffolk - Laborat d'innovation et de technologie légale (LIT)
- Université d'Ottawa - laboratoire de technologie juridique
- Université de Vienne - Département de l'innovation et de la numérisation en droit
- Université d'Amsterdam - Leibniz Center for Law
- Université d'Helsinki - Laboratoire de recherche LegalTech
- Université Hofstra - Laboratoire de recherche en droit, logique et technologie
- Études juridiques informatiques
- CIRSFID-AI - Université de Bologne
- IAAIL - Association internationale pour l'IA et le droit
- Asail - Détection automatisée, extraction et analyse des informations sémantiques dans les textes juridiques
- Atelier sur le traitement naturel du langage juridique: articles, modèles, ensembles de données et événements connexes
- IA et droit chinois (cail)
- Université de Copenhague, Icourts, le Danish National Research Foundation's Center of Excellence for International Courts
- Maastricht Law and Tech Lab
Tutoriels
Retour en haut
- Monkey Learn - Analyse de texte
- Utiliser la PNL pour comprendre les lois
- Représentation de documents pour les textes juridiques
- Science des données pour les avocats - Ressources d'apprentissage
- Codage pour les avocats (abandonnés)
- Approches NLP personnalisées pour l'anonymisation des données
- Extraction d'informations dans des documents juridiques
- NLP légal: classification des phrases et IA explicable
- Glossaire de l'IA juridique
- Centre d'apprentissage de l'IA juridique
Crédits
Retour en haut
Un grand merci à nos contributeurs et bien d'autres.
Ce travail est concédé sous licence Creative Commons Attribution-Sharealike 4.0.