Legal Textanalytics
Eine Liste ausgewählter Ressourcen, Methoden und Tools, die sich der Rechtstextanalyse widmen.

Bitte lesen Sie die Beitragsrichtlinien vor, bevor Sie einen Beitrag leisten. Bitte fügen Sie eine Ressource hinzu, indem Sie eine Pull -Anfrage erheben. Wir suchen auch nach Diskussionen und Vorschlägen neuer Ideen (einschließlich zusätzlicher Inhaltsabschnitte) als Themen.
Inhalt
- Ausgewählte Aufgaben und Anwendungsfälle
- Methoden
- Bibliotheken
- Datensätze und Daten
- Großsprachenmodelle und GPT
- Annotations- und Datenschemata
- Annotationsinstrumente
- Software (Schnittstellen)
- Forschungsgruppen und Labors
- Tutorials
Ausgewählte Aufgaben und Anwendungsfälle
Zurück nach oben
- OPTISCHE Charaktererkennung (finden Sie hier weitere Informationen)
- Vorverarbeitung des Rechtsdokuments (Weitere Informationen finden Sie hier)
- Klauselsegmentierung und Satzgrenzerkennung
- Informationsextraktion und genannte Entitätserkennung (finden Sie hier weitere Informationen)
- Rechtsnormklassifizierung
- Maschinelle Übersetzung
- Dokumentvergleich und semantische Matching
- Textübersicht
- Argument -Mining
- Frage Beantwortung
- Vorhersage des Rechtsfallergebnisses
- Rechtliche und regulatorische Überwachung
- Vorhersage der Rechtskritikalität
- Gerichtsgenerierung
- Referenz- und Kerneferenz -Extraktion
- Versammlung und Generation von Dokument
- Sprachtranskription
- Anomalieerkennung
- Datenanonymisierung
- Konsistenzprüfung
- Verarbeitung natürlicher Sprache im Rechtsbereich
Methoden
Zurück nach oben
- NLP -Fortschritt
- Textvisualisierungen
- Optische Charaktererkennung
- Regelbasierte Methoden für NLP, Apache Ruta, Jape Grammatik
- Statistisches NLP
- Rahmenbedingungen für maschinelles Lernen
- Neuronale Netzwerke und tiefes Lernen für das NLP -Tutorial
- Domänenanpassung (z. B. Forschungspapier)
Bibliotheken
Zurück nach oben
- Spacy - industrielle Natürliche Sprachverarbeitung
- Scikit - maschinelles Lernen in Python
- NLTK - natürliches Sprach -Toolkit
- Apache Uima
- Tor - Allgemeine Architektur für Texttechnik
- Umarmender Gesicht - Mehr als 1000 vorgeborene Transformator-/Einbettungsmodelle für die Rechtsdomäne
- Deutsches Bert -Modell: Deepet AI
- Flair - Sota NLP (inkl. Biomedizinische und rechtliche Daten)
- Blackstone - Legal benannte Entitätserkennung und Textkategorizer
- Rechtsreferenzerkennung - NEO -Suche
- Rechtsreferenzerkennung - offene Rechtsdaten
- Haystack - Transformatoren im Maßstab für Fragenbeantwortung und neuronale Suche
- Satzgrenze Erkennung (US -Staatsfest)
- Quantitative Rechtsstudien
- CITEURL - Ein erweiterbares Instrument zum Erkennen und Hyperlink -Rechtszitaten
- LEXNLP - Python NLP -Bibliothek für Recht Textanalyse
- Niederländische Rechtsprechungsabzug - Funktionen zur Erlangung veröffentlichter niederländischer Rechtsprechung (REHTSPRAAK) und verfügbaren Metadaten, die den Fällen zugeordnet sind
- Rechtsprechung Explorer - Materialien für den Aufbau einer Netzwerkanalyse -Softwareplattform zur Analyse niederländischer und europäischer Gerichtsentscheidungen
Datensätze und Daten
Zurück nach oben
- NLP -Datensätze
- Ein 800 -GB -Datensatz mit vielfältigem Text für die Sprachmodellierung
- Meta -Suche: Google -Datensatzsuche
- OpenLEGALDATA
- IR Ad-hoc-Ranking-Benchmarks, Trainingsdatensätze usw.
- Belgien: Belgischer gesetzlicher Artikel Abrufendatensatz (BSARD), einschließlich Code
- Tolle deutsche nlp
- Deutscher Datensatz zum Abrufen von Rechtsinformationen (Gerdalir)
- Anerkennung von Rechtsunternehmen
- Zusammenfassung der juristischen Text
- Übersetzung von Rechtstext
- Klassifizierung des Rechtsdokuments
- Klassifizierung der gesetzlichen Haftstrafe (Deutsch)
- 100k deutsche Gerichtsentscheidungen
- Rechtspapierdatensätze
- Lexklue: Ein Benchmark -Datensatz für das Verständnis der juristischen Sprache in Englisch
- Lextreme: Ein Multi-Lingual- und Multi-Task-Benchmark für die Rechtsdomäne
- Multilegalpile: Ein 689 GB mehrsprachiger Rechtskorpus
- Multilegalsbd: Ein mehrsprachiger Datensatz für die Erkennung von gesetzlichen Haftstrafen
- Multilegalneg
- Großartige Rechtsdaten
- Deutschland: Geetze im Internet, Rechtspreechung im Internet, Verwaltungsvorschriften im Internet
- Deutschland: kommentierte Gerichtsentscheidungen (Urteilsstil)
- Deutschland: Deutsche Bundesgerichte Datensatz
- Deutschland: Quantitative Datensatz von Anhörungen des Asylgerichts bei deutschen Verwaltungsgerichten. ASYFAIR
- Deutschland: Beantwortung rechtlicher Fragen von Laien im deutschen Zivilrechtssystem: Daten und Code. EACL Paper 2024
- Deutschland: Erkennung von Leerklauseln in deutschen Standardformularverbraucherverträgen
- Deutschland: Aktenzichen der Bundesrepublik Deutschland (AZ-BRD)
- Deutschland: Corpus des Deutschen Bundesrechts (C-DBR)
- Deutschland: Corpus-DER-VERSCHEIDUNGEN DES BUNDESVERFASSUNGSGERICHTS (CE-BVERFG)
- Deutschland: Corpus der Amtlichen Incdiungsssammung des Bundesverfassungsgerichts (C-Bverfge)
- Deutschland: Corona-Rechtsprechung des Bundesverfassungsgerichts (Bverfg-Corona)
- Deutschland: Corpus-DER-VERSCHEIDUNGEN DES BUNDESVERWALLTUNGSGERICHTS (CE-BVERWG)
- Deutschland: Corpus-DER-Ventes-Bundesarbeitgerichts (CE-Bag)
- Deutschland: Corpus-DER-VERSCHEIDUNGEN DES BUNDEPATENTGERICHTS (CE-BPATG)
- Deutschland: Corpus-DER-Ventes-Bundesgerichtshofs (CE-BGH)
- Deutschland: Präsidenten und Vizepräsidenten der Bundesgerichte von Deutschland (PVP-FCG)
- Deutschland: Stoppwörter der Deutschen Rechtssprache (SW-de-RS)
- Frankreich: Das französische Gerichtsstruktur Datensatz - FCD12K
- Schweiz: Schweizer Gesetzgebung Corpus Französisch und Deutsch
- Schweiz: Schweizer Datensatz des Obersten Gerichtshofs des Bundes (SCD)
- Schweiz: Schweizer Urteilsvorhersage
- Schweiz: Schweizer Urteilsvorhersage xl
- Schweiz: Schweizer Kritikalitätsvorhersage
- Schweiz: Schweizer Rechtsgebiet Vorhersage
- Schweiz: Schweizerische Entscheidungen
- Schweiz: Schweizer Gesetzgebung
- Schweiz: Schweizer Urteile
- Schweiz: Schweizerische Entscheidungsfindung
- Schweiz: Schweizer Zitierförderung
- Schweiz: Schweizergerichtsansicht Generation
- Schweiz: Schweizer DOC2DOC Information Abruf
- Türkei: Vorhersage der Ergebnisse in den höheren Gerichten der Türkei
- Indien: Indische Rechtsdokumente Corpus zur Vorhersage und Erklärung des Gerichtsurteils
- EGMR: Justizentscheidungen des Europäischen Gerichtshofs für Menschenrechte
- EGRHR: LACOUR!: Forschung zu Argumentation in Anhörungen des Europäischen Gerichtshofs für Menschenrechte ermöglichen
- EGMR: Argument Mining Corpus
- EU Law (EURLEX R -Paket), Digital Corpus des Europäischen Parlaments (DCEP)
- EU -Vorschrifteninformation Abruf der EU
- EU Lextreme
- Israel: Die Datenbank des israelischen Obersten Gerichtshofs
- Kanada: Bundesgesetze und Vorschriften (ftp://205.193.86.89/)
- Großbritannien: UK Law Reports & Rechtsrechtssuche
- UK: Cambridge Law Corpus
- Australien: Open Australian Legal Corpus - Das erste und einzige Multijurisdictional Open Corpus australischer Legislativ- und Justizdokumente
- US -gesetzlich vorgeschriebene Datensatzdatensatz
- US -Strafgesetz Grenzerkennungsdatensatz
- US -in- und ausschließliche Segmentierungsdatensätz
- US -Strafgesetz -Polaritätserkennung
- US -Zerstehungs -Zugangsprojekt
- US -Bundesstaatsbehöras über CourtListener -Zusammenfassung durch das Free.Law -Projekt beinhaltet eine API
- US -amerikanische Datenbank des Obersten Gerichtshofs
- US House of Repräsentativbüro des Rechtsrevisionsanwalts
- US Board of Veterans Appeals (BVA) Zitiervorhersage und Code
- Überblick über Politikwissenschaftsdatensätze: Pololdata
- Völkerrecht: Text der Handelsabkommen (TOTA)
- Völkerrecht: Korpus der Entscheidungen: Internationaler Gerichtshof (CD-ICJ)
- Völkerrecht: Korpus der Entscheidungen: Ständiger Gericht für internationale Justiz (CD-PCIJ)
- Vereinigte Nationen: General Debate Corpus der Vereinten Nationen, Parallelkorpus der Vereinten Nationen
- Vertragsverständnis Atticus -Datensatz durch das Atticus -Projekt: Ein Korpus von mehr als 13.000 Etiketten in 510 kommerziellen Rechtsverträgen mit reichhaltigen Expertenanmerkungen.
- KIRA Systems M & A-Datensatz von Kira Systems: Ein nicht kommerzielles Gebrauchsdatensatz mit 4.400 Dokumenten und Beschriftungen für 50 Rechtskonzepte in der M & A-Sorgfaltspflicht.
- Indien: ILSI -Datensatz für die Identifizierung von Rechtsgesetzen
- Indien: Datensatz für semantische Segmentierung / Rhetorische Rollenmarkierung
- Indien: Zusammenfassung mit mehreren Datensätzen
- Indien: Buildnyai
- Europäisches Patentbüro - EP Volltextdaten für Textanalysen
- Google Patente öffentliche Datensätze: Verbinden von öffentlichen, bezahlten und privaten Patentdaten
- Weltpatentinformationen (WPI) - Dokumentiert technische Domänen der Hauptpatentierungsbehörden
- Genocid Transcript Corpus (GTC)
Großsprachenmodelle und GPT
Zurück nach oben
- Siehe dediziertes Repository zu Großsprachenmodellen (LLMs) und generativen vorgebrachten Transformatoren (GPTs) für legale
- Chatgpt at OpenAI: Beispiele, Dokumentation, Preisgestaltung, Feinabstimmung Chatgpt
- Skizze zusammenfassen Chatgpt
- Großsprachige Modelle: Bericht von Ki Bundesverband
- Großsprachige Modelle: Umarmung des Gesichtsberichts
- Bericht über Einschränkungen von ChatGPT
- GPT nimmt die Barprüfung ab
- Rechtssprachmodelle
Annotations- und Datenschemata
Zurück nach oben
- Annotationsrichtlinien für die Anerkennung der juristischen Person (Deutschland)
- Semantische Arten von rechtlichen Normen
- Annotationsrichtlinien für die Ursache Grenzerkennung in der CASELAW (USA)
- Annotationsrichtlinien für den Satzwert in der gesetzlichen Auslegung (USA)
- SALI: Moderne Rechtsbranche Standards
Annotationsinstrumente
Zurück nach oben
- Fantastische Datenannotation
- Wunder
- Doccano
- Gör
Software (Schnittstellen)
Zurück nach oben
- Rechtsprechung Explorer - Softwareplattform für Netzwerkanalyse zur Analyse niederländischer und europäischer Gerichtsentscheidungen - Benutzerhandbuch
- Elektronische Datenbank zu Investitionsabkommen (Bearbeiten)
- GraphDOC - benutzerfreundliche grafische Schnittstelle, die Erstellen von Entscheidungsbäumen - Codebasis ermöglicht
- Gesp - Laden Sie alle öffentlich verfügbaren deutschen Gerichtsentscheidungen direkt von Ihrem Terminal herunter
Forschungsgruppen, Labors und Gemeinschaften
Zurück nach oben
- Stanford University - Codex: Das Stanford Center for Legal Informatics
- Technische Universität München
- Technische Universität München - Rechtstechnologiegruppe
- Bucerius Zentrum zum Rechtsberuf
- Suffolk Law School - LAB LABE (Legal Innovation & Technology)
- Universität Ottawa - Labor für Rechtstechnologie
- Universität Wien - Ministerium für Innovation und Digitalisierung im Gesetz
- Universität Amsterdam - Leibniz Center for Law
- Universität von Helsinki - LegalTech Research Lab
- Hofstra University - Lamage-, Logik- und Technologie -Forschungslabor
- Rechen rechtliche Studien
- CIRSFID-AI-Universität Bologna
- IAAIL - Internationale Vereinigung für KI und Recht
- ASAL - Automatisierte Erkennung, Extraktion und Analyse semantischer Informationen in juristischen Texten
- Workshop zur Verarbeitung natürlicher Rechtssprache: Papiere, Modelle, Datensätze und verwandte Ereignisse
- Chinesische KI und Recht (Cail)
- Universität Kopenhagen, ICOURTS, Exzellenzzentrum der dänischen Nationalen Forschungsstiftung für internationale Gerichte
- Maastricht Law and Tech Lab
Tutorials
Zurück nach oben
- Affen lernen - Textanalyse
- Verwenden von NLP, um Gesetze zu verstehen
- Dokumentvertretung für legale Texte
- Data Science für Anwälte - Lernressourcen
- Codierung für Anwälte (eingestellt)
- Benutzerdefinierte NLP -Ansätze zur Datenanonymisierung
- Informationsextraktion in Rechtsdokumenten
- Legal NLP: Satzklassifizierung und erklärbare KI
- Legal AI Glossar
- Legal AI Learning Center
Credits
Zurück nach oben
Vielen Dank an unsere Mitwirkenden und viele mehr.
Diese Arbeit ist im Rahmen einer Creative Commons Attribution-Sharealike 4.0 International Lizenz lizenziert.