Legal Text Analytics Download - Legal Text Analytics Quellcode herunterladen

Legal Text Analytics

Anderer Quellcode

1.0.0

Herunterladen

Legal Textanalytics

Eine Liste ausgewählter Ressourcen, Methoden und Tools, die sich der Rechtstextanalyse widmen.

Logo

Bitte lesen Sie die Beitragsrichtlinien vor, bevor Sie einen Beitrag leisten. Bitte fügen Sie eine Ressource hinzu, indem Sie eine Pull -Anfrage erheben. Wir suchen auch nach Diskussionen und Vorschlägen neuer Ideen (einschließlich zusätzlicher Inhaltsabschnitte) als Themen.

Inhalt

Ausgewählte Aufgaben und Anwendungsfälle
Methoden
Bibliotheken
Datensätze und Daten
Großsprachenmodelle und GPT
Annotations- und Datenschemata
Annotationsinstrumente
Software (Schnittstellen)
Forschungsgruppen und Labors
Tutorials

Credits

Ausgewählte Aufgaben und Anwendungsfälle

Zurück nach oben

OPTISCHE Charaktererkennung (finden Sie hier weitere Informationen)
Vorverarbeitung des Rechtsdokuments (Weitere Informationen finden Sie hier)
Klauselsegmentierung und Satzgrenzerkennung
Informationsextraktion und genannte Entitätserkennung (finden Sie hier weitere Informationen)
Rechtsnormklassifizierung
Maschinelle Übersetzung
Dokumentvergleich und semantische Matching
Textübersicht
Argument -Mining
Frage Beantwortung
Vorhersage des Rechtsfallergebnisses
Rechtliche und regulatorische Überwachung
Vorhersage der Rechtskritikalität
Gerichtsgenerierung
Referenz- und Kerneferenz -Extraktion
Versammlung und Generation von Dokument
Sprachtranskription
Anomalieerkennung
Datenanonymisierung
Konsistenzprüfung
Verarbeitung natürlicher Sprache im Rechtsbereich

Methoden

Zurück nach oben

NLP -Fortschritt
Textvisualisierungen
Optische Charaktererkennung
Regelbasierte Methoden für NLP, Apache Ruta, Jape Grammatik
Statistisches NLP
Rahmenbedingungen für maschinelles Lernen
Neuronale Netzwerke und tiefes Lernen für das NLP -Tutorial
Domänenanpassung (z. B. Forschungspapier)

Bibliotheken

Zurück nach oben

Spacy - industrielle Natürliche Sprachverarbeitung
Scikit - maschinelles Lernen in Python
NLTK - natürliches Sprach -Toolkit
Apache Uima
Tor - Allgemeine Architektur für Texttechnik
Umarmender Gesicht - Mehr als 1000 vorgeborene Transformator-/Einbettungsmodelle für die Rechtsdomäne
Deutsches Bert -Modell: Deepet AI
Flair - Sota NLP (inkl. Biomedizinische und rechtliche Daten)
Blackstone - Legal benannte Entitätserkennung und Textkategorizer
Rechtsreferenzerkennung - NEO -Suche
Rechtsreferenzerkennung - offene Rechtsdaten
Haystack - Transformatoren im Maßstab für Fragenbeantwortung und neuronale Suche
Satzgrenze Erkennung (US -Staatsfest)
Quantitative Rechtsstudien
CITEURL - Ein erweiterbares Instrument zum Erkennen und Hyperlink -Rechtszitaten
LEXNLP - Python NLP -Bibliothek für Recht Textanalyse
Niederländische Rechtsprechungsabzug - Funktionen zur Erlangung veröffentlichter niederländischer Rechtsprechung (REHTSPRAAK) und verfügbaren Metadaten, die den Fällen zugeordnet sind
Rechtsprechung Explorer - Materialien für den Aufbau einer Netzwerkanalyse -Softwareplattform zur Analyse niederländischer und europäischer Gerichtsentscheidungen

Datensätze und Daten

Zurück nach oben

NLP -Datensätze
Ein 800 -GB -Datensatz mit vielfältigem Text für die Sprachmodellierung
Meta -Suche: Google -Datensatzsuche
OpenLEGALDATA
IR Ad-hoc-Ranking-Benchmarks, Trainingsdatensätze usw.
Belgien: Belgischer gesetzlicher Artikel Abrufendatensatz (BSARD), einschließlich Code
Tolle deutsche nlp
Deutscher Datensatz zum Abrufen von Rechtsinformationen (Gerdalir)
Anerkennung von Rechtsunternehmen
Zusammenfassung der juristischen Text
Übersetzung von Rechtstext
Klassifizierung des Rechtsdokuments
Klassifizierung der gesetzlichen Haftstrafe (Deutsch)
100k deutsche Gerichtsentscheidungen
Rechtspapierdatensätze
Lexklue: Ein Benchmark -Datensatz für das Verständnis der juristischen Sprache in Englisch
Lextreme: Ein Multi-Lingual- und Multi-Task-Benchmark für die Rechtsdomäne
Multilegalpile: Ein 689 GB mehrsprachiger Rechtskorpus
Multilegalsbd: Ein mehrsprachiger Datensatz für die Erkennung von gesetzlichen Haftstrafen
Multilegalneg
Großartige Rechtsdaten
Deutschland: Geetze im Internet, Rechtspreechung im Internet, Verwaltungsvorschriften im Internet
Deutschland: kommentierte Gerichtsentscheidungen (Urteilsstil)
Deutschland: Deutsche Bundesgerichte Datensatz
Deutschland: Quantitative Datensatz von Anhörungen des Asylgerichts bei deutschen Verwaltungsgerichten. ASYFAIR
Deutschland: Beantwortung rechtlicher Fragen von Laien im deutschen Zivilrechtssystem: Daten und Code. EACL Paper 2024
Deutschland: Erkennung von Leerklauseln in deutschen Standardformularverbraucherverträgen
Deutschland: Aktenzichen der Bundesrepublik Deutschland (AZ-BRD)
Deutschland: Corpus des Deutschen Bundesrechts (C-DBR)
Deutschland: Corpus-DER-VERSCHEIDUNGEN DES BUNDESVERFASSUNGSGERICHTS (CE-BVERFG)
Deutschland: Corpus der Amtlichen Incdiungsssammung des Bundesverfassungsgerichts (C-Bverfge)
Deutschland: Corona-Rechtsprechung des Bundesverfassungsgerichts (Bverfg-Corona)
Deutschland: Corpus-DER-VERSCHEIDUNGEN DES BUNDESVERWALLTUNGSGERICHTS (CE-BVERWG)
Deutschland: Corpus-DER-Ventes-Bundesarbeitgerichts (CE-Bag)
Deutschland: Corpus-DER-VERSCHEIDUNGEN DES BUNDEPATENTGERICHTS (CE-BPATG)
Deutschland: Corpus-DER-Ventes-Bundesgerichtshofs (CE-BGH)
Deutschland: Präsidenten und Vizepräsidenten der Bundesgerichte von Deutschland (PVP-FCG)
Deutschland: Stoppwörter der Deutschen Rechtssprache (SW-de-RS)
Frankreich: Das französische Gerichtsstruktur Datensatz - FCD12K
Schweiz: Schweizer Gesetzgebung Corpus Französisch und Deutsch
Schweiz: Schweizer Datensatz des Obersten Gerichtshofs des Bundes (SCD)
Schweiz: Schweizer Urteilsvorhersage
Schweiz: Schweizer Urteilsvorhersage xl
Schweiz: Schweizer Kritikalitätsvorhersage
Schweiz: Schweizer Rechtsgebiet Vorhersage
Schweiz: Schweizerische Entscheidungen
Schweiz: Schweizer Gesetzgebung
Schweiz: Schweizer Urteile
Schweiz: Schweizerische Entscheidungsfindung
Schweiz: Schweizer Zitierförderung
Schweiz: Schweizergerichtsansicht Generation
Schweiz: Schweizer DOC2DOC Information Abruf
Türkei: Vorhersage der Ergebnisse in den höheren Gerichten der Türkei
Indien: Indische Rechtsdokumente Corpus zur Vorhersage und Erklärung des Gerichtsurteils
EGMR: Justizentscheidungen des Europäischen Gerichtshofs für Menschenrechte
EGRHR: LACOUR!: Forschung zu Argumentation in Anhörungen des Europäischen Gerichtshofs für Menschenrechte ermöglichen
EGMR: Argument Mining Corpus
EU Law (EURLEX R -Paket), Digital Corpus des Europäischen Parlaments (DCEP)
EU -Vorschrifteninformation Abruf der EU
EU Lextreme
Israel: Die Datenbank des israelischen Obersten Gerichtshofs
Kanada: Bundesgesetze und Vorschriften (ftp://205.193.86.89/)
Großbritannien: UK Law Reports & Rechtsrechtssuche
UK: Cambridge Law Corpus
Australien: Open Australian Legal Corpus - Das erste und einzige Multijurisdictional Open Corpus australischer Legislativ- und Justizdokumente
US -gesetzlich vorgeschriebene Datensatzdatensatz
US -Strafgesetz Grenzerkennungsdatensatz
US -in- und ausschließliche Segmentierungsdatensätz
US -Strafgesetz -Polaritätserkennung
US -Zerstehungs -Zugangsprojekt
US -Bundesstaatsbehöras über CourtListener -Zusammenfassung durch das Free.Law -Projekt beinhaltet eine API
US -amerikanische Datenbank des Obersten Gerichtshofs
US House of Repräsentativbüro des Rechtsrevisionsanwalts
US Board of Veterans Appeals (BVA) Zitiervorhersage und Code
Überblick über Politikwissenschaftsdatensätze: Pololdata
Völkerrecht: Text der Handelsabkommen (TOTA)
Völkerrecht: Korpus der Entscheidungen: Internationaler Gerichtshof (CD-ICJ)
Völkerrecht: Korpus der Entscheidungen: Ständiger Gericht für internationale Justiz (CD-PCIJ)
Vereinigte Nationen: General Debate Corpus der Vereinten Nationen, Parallelkorpus der Vereinten Nationen
Vertragsverständnis Atticus -Datensatz durch das Atticus -Projekt: Ein Korpus von mehr als 13.000 Etiketten in 510 kommerziellen Rechtsverträgen mit reichhaltigen Expertenanmerkungen.
KIRA Systems M & A-Datensatz von Kira Systems: Ein nicht kommerzielles Gebrauchsdatensatz mit 4.400 Dokumenten und Beschriftungen für 50 Rechtskonzepte in der M & A-Sorgfaltspflicht.
Indien: ILSI -Datensatz für die Identifizierung von Rechtsgesetzen
Indien: Datensatz für semantische Segmentierung / Rhetorische Rollenmarkierung
Indien: Zusammenfassung mit mehreren Datensätzen
Indien: Buildnyai
Europäisches Patentbüro - EP Volltextdaten für Textanalysen
Google Patente öffentliche Datensätze: Verbinden von öffentlichen, bezahlten und privaten Patentdaten
Weltpatentinformationen (WPI) - Dokumentiert technische Domänen der Hauptpatentierungsbehörden
Genocid Transcript Corpus (GTC)

Großsprachenmodelle und GPT

Zurück nach oben

Siehe dediziertes Repository zu Großsprachenmodellen (LLMs) und generativen vorgebrachten Transformatoren (GPTs) für legale
Chatgpt at OpenAI: Beispiele, Dokumentation, Preisgestaltung, Feinabstimmung Chatgpt
Skizze zusammenfassen Chatgpt
Großsprachige Modelle: Bericht von Ki Bundesverband
Großsprachige Modelle: Umarmung des Gesichtsberichts
Bericht über Einschränkungen von ChatGPT
GPT nimmt die Barprüfung ab
Rechtssprachmodelle

Annotations- und Datenschemata

Zurück nach oben

Annotationsrichtlinien für die Anerkennung der juristischen Person (Deutschland)
Semantische Arten von rechtlichen Normen
Annotationsrichtlinien für die Ursache Grenzerkennung in der CASELAW (USA)
Annotationsrichtlinien für den Satzwert in der gesetzlichen Auslegung (USA)
SALI: Moderne Rechtsbranche Standards

Annotationsinstrumente

Zurück nach oben

Fantastische Datenannotation
Wunder
Doccano
Gör

Software (Schnittstellen)

Zurück nach oben

Rechtsprechung Explorer - Softwareplattform für Netzwerkanalyse zur Analyse niederländischer und europäischer Gerichtsentscheidungen - Benutzerhandbuch
Elektronische Datenbank zu Investitionsabkommen (Bearbeiten)
GraphDOC - benutzerfreundliche grafische Schnittstelle, die Erstellen von Entscheidungsbäumen - Codebasis ermöglicht
Gesp - Laden Sie alle öffentlich verfügbaren deutschen Gerichtsentscheidungen direkt von Ihrem Terminal herunter

Forschungsgruppen, Labors und Gemeinschaften

Zurück nach oben

Stanford University - Codex: Das Stanford Center for Legal Informatics
Technische Universität München
Technische Universität München - Rechtstechnologiegruppe
Bucerius Zentrum zum Rechtsberuf
Suffolk Law School - LAB LABE (Legal Innovation & Technology)
Universität Ottawa - Labor für Rechtstechnologie
Universität Wien - Ministerium für Innovation und Digitalisierung im Gesetz
Universität Amsterdam - Leibniz Center for Law
Universität von Helsinki - LegalTech Research Lab
Hofstra University - Lamage-, Logik- und Technologie -Forschungslabor
Rechen rechtliche Studien
CIRSFID-AI-Universität Bologna
IAAIL - Internationale Vereinigung für KI und Recht
ASAL - Automatisierte Erkennung, Extraktion und Analyse semantischer Informationen in juristischen Texten
Workshop zur Verarbeitung natürlicher Rechtssprache: Papiere, Modelle, Datensätze und verwandte Ereignisse
Chinesische KI und Recht (Cail)
Universität Kopenhagen, ICOURTS, Exzellenzzentrum der dänischen Nationalen Forschungsstiftung für internationale Gerichte
Maastricht Law and Tech Lab

Tutorials

Zurück nach oben

Affen lernen - Textanalyse
Verwenden von NLP, um Gesetze zu verstehen
Dokumentvertretung für legale Texte
Data Science für Anwälte - Lernressourcen
Codierung für Anwälte (eingestellt)
Benutzerdefinierte NLP -Ansätze zur Datenanonymisierung
Informationsextraktion in Rechtsdokumenten
Legal NLP: Satzklassifizierung und erklärbare KI
Legal AI Glossar
Legal AI Learning Center

Credits

Zurück nach oben

Vielen Dank an unsere Mitwirkenden und viele mehr.

Diese Arbeit ist im Rahmen einer Creative Commons Attribution-Sharealike 4.0 International Lizenz lizenziert.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-04-19
Größe 2.71MB
Kommt von Github

Ähnliche Anwendungen

Text mit Jesus-Chinesisch

2023-08-23
Text mit Jesus

2023-08-17
Text mit Jesus chinesische Version

2023-08-17
Text oder stirb

2023-07-03
Legal Dungeon

2022-09-04
RTE (Rich Text Editor) ASP.NET

2011-05-25

Legal Text Analytics