Analisis Teks Hukum
Daftar sumber daya, metode, dan alat yang dipilih yang didedikasikan untuk analisis teks hukum.

Harap baca pedoman kontribusi sebelum berkontribusi. Harap tambahkan sumber daya dengan mengajukan permintaan tarik. Kami juga mencari diskusi dan proposal ide -ide baru (termasuk bagian konten tambahan) sebagai masalah.
Isi
- Tugas yang Dipilih dan Kasing Penggunaan
- Metode
- Perpustakaan
- Kumpulan data dan data
- Model bahasa besar dan gpt
- Skema anotasi dan data
- Alat Anotasi
- Perangkat lunak (antarmuka)
- Kelompok penelitian dan laboratorium
- Tutorial
Tugas yang Dipilih dan Kasing Penggunaan
Kembali ke atas
- Pengenalan karakter optik (Temukan informasi lebih lanjut di sini)
- Dokumen Hukum Pra-Pemrosesan (Temukan informasi lebih lanjut di sini)
- Deteksi Batas Segmentasi dan Kalimat
- Ekstraksi informasi dan pengakuan entitas yang disebutkan (temukan informasi lebih lanjut di sini)
- Klasifikasi Norma Hukum
- Terjemahan mesin
- Perbandingan dokumen dan pencocokan semantik
- Ringkasan teks
- Penambangan argumen
- Pertanyaan menjawab
- Prediksi hasil kasus hukum
- Pemantauan hukum dan peraturan
- Prediksi kritisitas hukum
- Generasi Pandangan Pengadilan
- Ekstraksi Referensi dan Coreference
- Perakitan dan Generasi Dokumen
- Transkripsi suara
- Deteksi anomali
- Anonimisasi Data
- Pemeriksaan Konsistensi
- Pemrosesan bahasa alami di domain hukum
Metode
Kembali ke atas
- Kemajuan NLP
- Visualisasi teks
- Pengenalan karakter optik
- Metode Berbasis Aturan untuk NLP, Apache Ruta, Tata Bahasa Jape
- NLP statistik
- Kerangka kerja pembelajaran mesin
- Jaringan saraf dan pembelajaran mendalam untuk tutorial NLP
- Adaptasi domain (misalnya, makalah penelitian)
Perpustakaan
Kembali ke atas
- Spacy - Pemrosesan Bahasa Alami Kekuatan Industri
- Scikit - Pembelajaran Mesin di Python
- NLTK - Toolkit Bahasa Alami
- Apache Uima
- Gerbang - Arsitektur Umum untuk Teknik Teks
- Face Hugging - Lebih dari 1000 model transformator/embedding pra -terlatih untuk domain hukum
- Model Bert Jerman: Deepset AI
- Flair - SOTA NLP (termasuk data biomedis dan hukum)
- Blackstone - Pengakuan Entitas yang Dinamai Legal dan Kategorisasi Teks
- Deteksi Referensi Hukum - Pencarian Neo
- Deteksi Referensi Hukum - Data Hukum Terbuka
- Haystack - Transformers pada skala untuk menjawab pertanyaan & pencarian saraf
- Deteksi Batas Kalimat (US Caselaw)
- Studi Hukum Kuantitatif
- Citeurl - Alat yang dapat diperluas untuk mendeteksi dan hyperlink legal kutipan
- LEXNLP - Perpustakaan Python NLP untuk Analisis Teks Hukum
- Ekstraktor hukum kasus Belanda - Fungsi untuk mendapatkan data Dutch Case Law (Rechtpraak) yang dipublikasikan dan metadata yang tersedia terkait dengan kasus tersebut
- Case Law Explorer - Bahan untuk Membangun Platform Perangkat Lunak Analisis Jaringan untuk Menganalisis Keputusan Pengadilan Belanda dan Eropa
Kumpulan data dan data
Kembali ke atas
- Dataset NLP
- Dataset 800GB dari beragam teks untuk pemodelan bahasa
- Pencarian Meta: Pencarian Dataset Google
- Openlegaldata
- IR Ad-Hoc Ranking Benchmark, Dataset Pelatihan, dll.
- Belgia: Dataset Pengambilan Artikel Hukum Belgia (BSARD), termasuk kode
- NLP Jerman yang luar biasa
- Dataset Jerman untuk Pengambilan Informasi Hukum (Gerdalir)
- Pengakuan Legal Entitas
- Ringkasan Teks Hukum
- Terjemahan teks hukum
- Klasifikasi Dokumen Hukum
- Klasifikasi Kalimat Hukum (Jerman)
- 100K Keputusan Pengadilan Jerman
- Dataset Kertas Hukum
- LEXGLUE: Dataset Benchmark untuk Pemahaman Bahasa Hukum dalam Bahasa Inggris
- Lextreme: Benchmark multi-bahasa dan multi-tugas untuk domain hukum
- Multilegalpile: Corpus hukum multibahasa 689GB
- Multilegalsbd: Dataset Deteksi Batas Kalimat Hukum Multilingual
- Multilegalneg
- Data hukum yang luar biasa
- Jerman: gesetze im internet, rechtprechung im internet, verwaltungsvorschriften im internet
- Jerman: Keputusan Pengadilan Beranotasi (Gaya Penghakiman)
- Jerman: Dataset Pengadilan Federal Jerman
- Jerman: Dataset kuantitatif sidang pengadilan suaka di pengadilan administrasi Jerman. Asyfair
- Jerman: Menjawab pertanyaan hukum dari orang awam dalam sistem hukum perdata Jerman: data dan kode. EACL Paper 2024
- Jerman: Mendeteksi Klausul Kekosongan dalam Kontrak Konsumen Standar Standar Jerman
- Jerman: Aktenzeichen der Bundesrepublik Deutschland (AZ-BRD)
- Jerman: Corpus des Deutschen Bundesrechts (C-DBR)
- Jerman: Corpus derscheidungen des Bundesverfassungsgerichts (CE-BVERFG)
- Jerman: Corpus der Amtlichen entscheidungssamlung des Bundesverfassungsgerichts (C-BVERFGE)
- Jerman: Corona-Rechtsprechung des Bundesverfassungsgerichts (BVERFG-CORONA)
- Jerman: Corpus derscheidungen des Bundesverwaltungsgerichts (CE-BVERWG)
- Jerman: Corpus derscheidungen des Bundesarbeitsgerichts (CE-Bag)
- Jerman: Corpus derscheidungen des Bundespatentgerichts (CE-BPATG)
- Jerman: Corpus derscheidungen des Bundesgerichtshofs (CE-BGH)
- Jerman: Presiden dan Wakil Presiden Pengadilan Federal Jerman (PVP-FCG)
- Jerman: Stoppwörter der Deutschen Rechtssprache (SW-DE-RS)
- Prancis: Dataset Struktur Keputusan Pengadilan Prancis - FCD12K
- Swiss: Corpus Legislasi Swiss Prancis dan Jerman
- Swiss: Dataset Mahkamah Agung Federal Swiss (SCD)
- Swiss: Prediksi penilaian Swiss
- Swiss: Prediksi Penilaian Swiss XL
- Swiss: Prediksi Kritik Swiss
- Swiss: Prediksi Area Hukum Swiss
- Swiss: Keputusan terkemuka Swiss
- Swiss: Legislasi Swiss
- Swiss: Putusan Swiss
- Swiss: Peringkasan Keputusan Terkemuka Swiss
- Swiss: Ekstraksi Kutipan Swiss
- Swiss: Generasi Pandangan Pengadilan Swiss
- Swiss: Pengambilan Informasi Doc2Doc Swiss
- Turki: Prediksi Hasil di Pengadilan Tinggi Turki
- India: Dokumen Hukum India Korpus untuk prediksi dan penjelasan putusan pengadilan
- ECTHR: Keputusan Yudisial Pengadilan Hak Asasi Manusia Eropa
- ECTHR: Lacour!: Mengaktifkan penelitian tentang argumentasi dalam audiensi Pengadilan Hak Asasi Manusia Eropa
- ECTHR: Corpus Argumen Penambangan
- Hukum Uni Eropa (paket Eurlex R), Corpus Digital Parlemen Eropa (DCEP)
- Pengambilan Informasi Kepatuhan Pengaturan UE
- EU Lextreme
- Israel: Database Mahkamah Agung Israel
- Kanada: Hukum dan Peraturan Federal (ftp://205.193.86.89/)
- Inggris: Laporan Hukum Inggris & Pencarian Hukum Kasus
- Inggris: Cambridge Law Corpus
- Australia: Korpus Hukum Australia Terbuka - Korpus terbuka multijurisdiksi pertama dan satu -satunya dokumen legislatif dan peradilan Australia
- Kumpulan data interpretasi hukum hukum AS
- Dataset Deteksi Batas Kalimat Caselaw AS
- US Caselaw Functional dan mengeluarkan dataset segmentasi spesifik
- Deteksi Polaritas Kalimat Caselaw AS
- Proyek Akses US Caselaw
- Caselaw federal AS melalui Rekap Pengadilan Pengadilan oleh Proyek Free.Law, Termasuk API
- Database Mahkamah Agung AS
- Kantor Dewan Perwakilan Dewan Perwakilan US Penasihat Revisi Hukum
- Dataset dan Kode Prediksi Kutipan Dewan Veteran AS (BVA)
- Tinjauan Dataset Ilmu Politik: Poldata
- Hukum Internasional: Teks Perjanjian Perdagangan (TOTA)
- Hukum Internasional: Korpus Keputusan: Pengadilan Internasional (CD-ICJ)
- Hukum Internasional: Korpus Keputusan: Pengadilan Permanen Keadilan Internasional (CD-PCIJ)
- PBB: Corpus Debat Umum PBB, Corpus Paralel Perserikatan Bangsa -Bangsa
- Kontrak Memahami Dataset Atticus oleh Proyek Atticus: Korpus 13.000+ label dalam 510 Kontrak Hukum Komersial dengan Anotasi Ahli yang Kaya.
- Kira Systems M&A Dataset oleh KIRA Systems: Dataset penggunaan non-komersial yang terdiri dari 4.400 dokumen dan label untuk 50 konsep hukum dalam pengaturan uji tuntas M&A.
- India: Dataset ILSI untuk Identifikasi Statuta Hukum
- India: Dataset untuk Segmentasi Semantik / Pelabelan Peran Retorika
- India: Ringkasan dengan banyak set data
- India: Buildnyai
- Kantor Paten Eropa - EP Data teks lengkap untuk analisis teks
- Dataset Publik Paten Google: Menghubungkan Data Publik, Dibayar, dan Paten Pribadi
- Informasi Paten Dunia (WPI) - Dokumen Domain Teknis dari Otoritas Paten Utama
- Genosida Transcript Corpus (GTC)
Model bahasa besar dan gpt
Kembali ke atas
- Lihat repositori khusus pada model bahasa besar (LLM) dan transformer pra-terlatih generatif (GPT) untuk legal
- Chatgpt di openai: contoh, dokumentasi, harga, chatgpt yang menyempurnakan
- Sketsa meringkas chatgpt
- Model Bahasa Besar: Laporan oleh Ki Bundesverband
- Model Bahasa Besar: Laporan Wajah Memeluk
- Laporkan batasan chatgpt
- GPT mengikuti ujian bar
- Model Bahasa Hukum
Skema anotasi dan data
Kembali ke atas
- Pedoman Anotasi untuk Pengakuan Usaha Hukum (Jerman)
- Jenis norma hukum semantik
- Pedoman Anotasi untuk Deteksi Batas Kalimat di Caselaw (AS)
- Pedoman Anotasi untuk Nilai Kalimat dalam Interpretasi Hukum (AS)
- SALI: Standar Industri Hukum Modern
Alat Anotasi
Kembali ke atas
- Anotasi data yang luar biasa
- Keajaiban
- Doccano
- Anak nakal
Perangkat lunak (antarmuka)
Kembali ke atas
- Case Law Explorer - Platform Perangkat Lunak Analisis Jaringan untuk Menganalisis Keputusan Pengadilan Belanda dan Eropa - Panduan Pengguna
- Database Elektronik tentang Perjanjian Investasi (Edit)
- GraphDoc - Antarmuka grafis yang ramah pengguna yang memungkinkan membangun pohon keputusan - basis kode
- GESP - Unduh semua keputusan pengadilan Jerman yang tersedia untuk umum langsung dari terminal Anda
Kelompok Penelitian, Laboratorium, dan Komunitas
Kembali ke atas
- Universitas Stanford - Codex: Pusat Informatika Hukum Stanford
- Universitas Teknis Munich
- Universitas Teknis Munich - Kelompok Teknologi Hukum
- Pusat Bucerius di Profesi Hukum
- Suffolk Law School - Laboratorium & Teknologi Hukum (LIT) Lab
- University of Ottawa - Lab Teknologi Hukum
- Universitas Wina - Departemen Inovasi dan Digitalisasi dalam Hukum
- University of Amsterdam - Leibniz Center for Law
- University of Helsinki - Laboratorium Penelitian Penelitian Legal
- Hofstra University - Laboratorium Penelitian Hukum & Teknologi
- Studi Hukum Komputasi
- CIRSFID-AI-Universitas Bologna
- IAAIL - Asosiasi Internasional untuk AI dan Hukum
- ASAIL - Deteksi otomatis, ekstraksi dan analisis informasi semantik dalam teks hukum
- Lokakarya tentang Pemrosesan Bahasa Hukum Alam: Makalah, Model, Set Data, dan Acara Terkait
- AI dan Hukum Cina (Cail)
- University of Copenhagen, Icourts, Pusat Keunggulan Yayasan Penelitian Nasional Denmark untuk Pengadilan Internasional
- Maastricht Law and Tech Lab
Tutorial
Kembali ke atas
- Monkey Learn - Analisis Teks
- Menggunakan NLP untuk memahami undang -undang
- Representasi dokumen untuk teks hukum
- Ilmu Data untuk Pengacara - Sumber Belajar
- Pengkodean untuk pengacara (dihentikan)
- Pendekatan NLP khusus untuk anonimisasi data
- Ekstraksi informasi dalam dokumen hukum
- NLP Hukum: Klasifikasi Kalimat dan AI
- Daftar Istilah AI Legal
- Pusat Pembelajaran AI Legal
Kredit
Kembali ke atas
Terima kasih banyak kepada kontributor kami dan banyak lagi.
Karya ini dilisensikan di bawah lisensi internasional Creative Commons Attribution-Sharealike 4.0.