การวิเคราะห์ข้อความทางกฎหมาย
รายการทรัพยากรวิธีการและเครื่องมือที่เลือกไว้สำหรับการวิเคราะห์ข้อความทางกฎหมาย

โปรดอ่านแนวทางการบริจาคก่อนที่จะมีส่วนร่วม โปรดเพิ่มทรัพยากรโดยเพิ่มคำขอดึง นอกจากนี้เรายังขอการอภิปรายและข้อเสนอความคิดใหม่ ๆ (รวมถึงส่วนเนื้อหาเพิ่มเติม) เป็นปัญหา
สารบัญ
- งานที่เลือกและกรณีการใช้งาน
- วิธีการ
- ห้องสมุด
- ชุดข้อมูลและข้อมูล
- รูปแบบภาษาขนาดใหญ่และ GPT
- คำอธิบายประกอบและแผนการข้อมูล
- เครื่องมือคำอธิบายประกอบ
- ซอฟต์แวร์ (อินเทอร์เฟซ)
- กลุ่มวิจัยและห้องปฏิบัติการ
- บทเรียน
งานที่เลือกและกรณีการใช้งาน
กลับไปด้านบน
- การจดจำอักขระออพติคอล (ค้นหาข้อมูลเพิ่มเติมที่นี่)
- การประมวลผลเอกสารกฎหมายล่วงหน้า (ค้นหาข้อมูลเพิ่มเติมที่นี่)
- การแบ่งส่วนประโยคและการตรวจจับขอบเขตประโยค
- การสกัดข้อมูลและการจดจำเอนทิตีที่มีชื่อ (ค้นหาข้อมูลเพิ่มเติมที่นี่)
- การจำแนกบรรทัดฐานทางกฎหมาย
- การแปลเครื่องจักร
- การเปรียบเทียบเอกสารและการจับคู่ความหมาย
- การสรุปข้อความ
- การทำเหมืองอาร์กิวเมนต์
- ตอบคำถาม
- การทำนายผลการดำเนินการตามกฎหมาย
- การตรวจสอบทางกฎหมายและกฎระเบียบ
- การทำนายความสำคัญทางกฎหมาย
- รุ่นมุมมองของศาล
- การอ้างอิงและการแยก coreference
- การรวบรวมเอกสารและการสร้าง
- การถอดเสียง
- การตรวจจับความผิดปกติ
- การไม่เปิดเผยตัวตนของข้อมูล
- การตรวจสอบความสอดคล้อง
- การประมวลผลภาษาธรรมชาติในโดเมนกฎหมาย
วิธีการ
กลับไปด้านบน
- ความคืบหน้าของ NLP
- การสร้างภาพข้อความ
- การจดจำตัวละครแบบออพติคอล
- วิธีการตามกฎสำหรับ NLP, Apache Ruta, Jape Grammar
- สถิติ NLP
- เฟรมเวิร์กการเรียนรู้ของเครื่องจักร
- เครือข่ายประสาทและการเรียนรู้อย่างลึกซึ้งสำหรับการสอน NLP
- การปรับโดเมน (เช่นรายงานการวิจัย)
ห้องสมุด
กลับไปด้านบน
- Spacy - การประมวลผลภาษาธรรมชาติที่มีความแข็งแกร่งทางอุตสาหกรรม
- Scikit - การเรียนรู้ของเครื่องจักรใน Python
- NLTK - ชุดเครื่องมือภาษาธรรมชาติ
- Apache uima
- ประตู - สถาปัตยกรรมทั่วไปสำหรับวิศวกรรมข้อความ
- Hugging Face - มากกว่า 1,000 รุ่นหม้อแปลง/การฝังที่ผ่านการฝึกอบรมมาก่อนสำหรับโดเมนทางกฎหมาย
- Model Bert เยอรมัน: DeepSet AI
- Flair - Sota NLP (รวมข้อมูลด้านชีวการแพทย์และกฎหมาย)
- แบล็กสโตน - การรับรู้เอนทิตีที่มีชื่อตามกฎหมาย
- การตรวจจับการอ้างอิงทางกฎหมาย - การค้นหานีโอ
- การตรวจจับการอ้างอิงทางกฎหมาย - เปิดข้อมูลทางกฎหมาย
- Haystack - Transformers ในระดับสำหรับการตอบคำถามและการค้นหาประสาท
- การตรวจจับขอบเขตประโยค (US caselaw)
- การศึกษาด้านกฎหมายเชิงปริมาณ
- CITEURL - เครื่องมือที่ขยายได้ในการตรวจจับและการอ้างอิงทางกฎหมายไฮเปอร์ลิงก์
- Lexnlp - Library NLP Python สำหรับการวิเคราะห์ข้อความทางกฎหมาย
- สารสกัดกฎหมายกรณีดัตช์ - ฟังก์ชั่นเพื่อรับข้อมูลกฎหมายกรณีดัตช์ที่เผยแพร่ (RechtSPRAAK) และข้อมูลเมตาที่เกี่ยวข้องกับกรณี
- Case Law Explorer - วัสดุสำหรับการสร้างแพลตฟอร์มซอฟต์แวร์การวิเคราะห์เครือข่ายสำหรับการวิเคราะห์การตัดสินใจของศาลชาวดัตช์และยุโรป
ชุดข้อมูลและข้อมูล
กลับไปด้านบน
- ชุดข้อมูล NLP
- ชุดข้อมูล 800GB ของข้อความที่หลากหลายสำหรับการสร้างแบบจำลองภาษา
- Meta Search: การค้นหาชุดข้อมูลของ Google
- Openlegaldata
- มาตรฐานการจัดอันดับ IR Ad-Hoc ชุดข้อมูลการฝึกอบรม ฯลฯ
- เบลเยียม: ชุดข้อมูลการดึงข้อมูลบทความเบลเยียม (BSARD) รวมถึงรหัสตามกฎหมายรวมถึงรหัส
- NLP เยอรมันที่ยอดเยี่ยม
- ชุดข้อมูลภาษาเยอรมันสำหรับการดึงข้อมูลทางกฎหมาย (Gerdalir)
- การรับรู้นิติบุคคล
- การสรุปข้อความทางกฎหมาย
- การแปลข้อความทางกฎหมาย
- การจำแนกเอกสารทางกฎหมาย
- การจำแนกประเภทประโยคทางกฎหมาย (ภาษาเยอรมัน)
- การตัดสินใจของศาลเยอรมัน 100k
- ชุดข้อมูลเอกสารทางกฎหมาย
- Lexglue: ชุดข้อมูลมาตรฐานสำหรับการทำความเข้าใจภาษากฎหมายเป็นภาษาอังกฤษ
- Lextreme: เกณฑ์มาตรฐานหลายภาษาและหลายงานสำหรับโดเมนทางกฎหมาย
- Multilegalpile: 689GB หลายภาษาคลังข้อมูล
- MultileGalsBD: ชุดข้อมูลการตรวจจับขอบเขตประโยคหลายภาษาหลายภาษา
- หลายสายพันธุ์
- ข้อมูลทางกฎหมายที่ยอดเยี่ยม
- ประเทศเยอรมนี: Gesetze IM Internet, Rechtsprechung IM Internet, Verwaltungsvorschriften IM Internet
- ประเทศเยอรมนี: การตัดสินใจของศาลหมายเหตุ (รูปแบบการตัดสิน)
- เยอรมนี: ชุดข้อมูลศาลของรัฐบาลกลางเยอรมัน
- ประเทศเยอรมนี: ชุดข้อมูลเชิงปริมาณของการพิจารณาคดีศาลลี้ภัยที่ศาลบริหารของเยอรมัน Asyfair
- เยอรมนี: ตอบคำถามทางกฎหมายจากฆราวาสในระบบกฎหมายแพ่งของเยอรมัน: ข้อมูลและรหัส EACL PAPER 2024
- ประเทศเยอรมนี: การตรวจจับข้อโมฆะในสัญญาผู้บริโภคแบบฟอร์มมาตรฐานของเยอรมัน
- เยอรมนี: Aktenzeichen der Bundesrepublik Deutschland (AZ-BRD)
- เยอรมนี: Corpus des Deutschen Bundesrechts (C-DBR)
- เยอรมนี: Corpus der Eentscheidungen des Bundesverfassungsgerichts (CE-Bverfg)
- ประเทศเยอรมนี: Corpus der Amtlichen entscheidungssmamlung des bundesverfassungsgerichts (C-bverfge)
- เยอรมนี: Corona-Rechtsprechung des Bundesverfassungsgerichts (Bverfg-Corona)
- เยอรมนี: Corpus der Eentscheidungen des Bundesverwaltungsgerichts (CE-Bverwg)
- เยอรมนี: Corpus der Eentscheidungen des Bundesarbeitsgerichts (CE-BAG)
- เยอรมนี: Corpus der Eentscheidungen des Bundespatentgerichts (CE-BPATG)
- เยอรมนี: Corpus der Eentscheidungen des Bundesgerichtshofs (CE-BGH)
- เยอรมนี: ประธานาธิบดีและรองประธานาธิบดีของศาลรัฐบาลกลางแห่งเยอรมนี (PVP-FCG)
- เยอรมนี: Stoppwörter der Deutschen Rechtssprache (SW-DE-RS)
- ฝรั่งเศส: ชุดข้อมูลโครงสร้างการตัดสินใจของศาลฝรั่งเศส - FCD12K
- สวิตเซอร์แลนด์: กฎหมายสวิสคอร์ปัสฝรั่งเศสและเยอรมัน
- สวิตเซอร์แลนด์: ชุดข้อมูลศาลฎีกาของสหพันธรัฐสวิส (SCD)
- สวิตเซอร์แลนด์: การทำนายการตัดสินของสวิส
- สวิตเซอร์แลนด์: การทำนายการตัดสินของสวิส XL
- สวิตเซอร์แลนด์: การทำนายวิกฤตสวิส
- สวิตเซอร์แลนด์: การทำนายพื้นที่กฎหมายสวิส
- สวิตเซอร์แลนด์: การตัดสินใจชั้นนำของสวิส
- สวิตเซอร์แลนด์: กฎหมายสวิส
- สวิตเซอร์แลนด์: คำวินิจฉัยของสวิส
- สวิตเซอร์แลนด์: การสรุปการตัดสินใจชั้นนำของสวิส
- สวิตเซอร์แลนด์: สกัดการอ้างอิงของสวิส
- สวิตเซอร์แลนด์: การสร้างมุมมองของศาลสวิส
- สวิตเซอร์แลนด์: การดึงข้อมูล Swiss DOC2DOC
- ตุรกี: การทำนายผลลัพธ์ในศาลที่สูงขึ้นของตุรกี
- อินเดีย: เอกสารทางกฎหมายของอินเดียคลังข้อมูลการทำนายคำพิพากษาและคำอธิบายของศาล
- ECTHR: การตัดสินใจของศาลของศาลสิทธิมนุษยชนแห่งยุโรป
- ECTHR: lacour !: การเปิดใช้งานการวิจัยเกี่ยวกับการโต้แย้งในการพิจารณาคดีของศาลสิทธิมนุษยชนแห่งยุโรป
- ECTHR: อาร์กิวเมนต์การขุดคลังข้อมูล
- กฎหมายของสหภาพยุโรป (แพ็คเกจ Eurlex R), คลังข้อมูลดิจิตอลของรัฐสภายุโรป (DCEP)
- การดึงข้อมูลการปฏิบัติตามกฎระเบียบของสหภาพยุโรป
- EU Lextreme
- อิสราเอล: ฐานข้อมูลศาลฎีกาของอิสราเอล
- แคนาดา: กฎหมายและข้อบังคับของรัฐบาลกลาง (FTP://205.193.86.89/)
- สหราชอาณาจักร: รายงานกฎหมายและการค้นหากฎหมายกรณีของสหราชอาณาจักร
- สหราชอาณาจักร: Cambridge Law Corpus
- ออสเตรเลีย: Open Australian Legal Corpus - คลังข้อมูล Open Open Open Open ของกฎหมายและเอกสารตุลาการของออสเตรเลียแห่งแรกและแห่งเดียว
- ชุดข้อมูลการตีความกฎหมายตามกฎหมายของสหรัฐอเมริกา
- ชุดข้อมูลการตรวจจับขอบเขตประโยคของเรา
- ชุดข้อมูลการแบ่งส่วนที่เฉพาะเจาะจงของสหรัฐอเมริกา
- การตรวจจับขั้วของประโยค caselaw ของเรา
- โครงการเข้าถึง Caselaw ของสหรัฐอเมริกา
- US Federal Caselaw ผ่าน CourtListener Recap โดย Free.law Project รวมถึง API
- ฐานข้อมูลศาลฎีกาของสหรัฐอเมริกา
- สำนักงานที่ปรึกษาด้านกฎหมายของสหรัฐอเมริกาสภาผู้แทนราษฎร
- ชุดข้อมูลการทำนายการอ้างอิงของคณะกรรมการทหารผ่านศึก (BVA) ของสหรัฐอเมริกา
- ภาพรวมของชุดข้อมูลรัฐศาสตร์: Poldata
- กฎหมายระหว่างประเทศ: ข้อความข้อตกลงการค้า (TOTA)
- กฎหมายระหว่างประเทศ: คลังข้อมูลการตัดสินใจ: ศาลยุติธรรมระหว่างประเทศ (CD-ICJ)
- กฎหมายระหว่างประเทศ: คลังข้อมูลการตัดสินใจ: ศาลยุติธรรมระหว่างประเทศถาวร (CD-PCIJ)
- สหประชาชาติ: คลังอภิปรายทั่วไปของสหประชาชาติ, สหประชาชาติขนานคลังข้อมูล
- ชุดข้อมูลการทำความเข้าใจสัญญา Atticus โดยโครงการ Atticus: คลังข้อมูลของป้ายกำกับมากกว่า 13,000 รายการในสัญญาทางกฎหมายเชิงพาณิชย์ 510 รายการที่มีคำอธิบายประกอบผู้เชี่ยวชาญที่หลากหลาย
- ชุดข้อมูล KIRA Systems M&A โดย Kira Systems: ชุดข้อมูลการใช้งานที่ไม่ใช่เชิงพาณิชย์ประกอบด้วยเอกสารและฉลาก 4,400 ฉบับสำหรับแนวคิดทางกฎหมาย 50 รายการในการตั้งค่าการตรวจสอบ M&A
- อินเดีย: ชุดข้อมูล ILSI สำหรับการระบุกฎหมายกฎหมาย
- อินเดีย: ชุดข้อมูลสำหรับการแบ่งส่วนความหมาย / การติดฉลากบทบาทวาทศิลป์
- อินเดีย: การสรุปด้วยชุดข้อมูลหลายชุด
- อินเดีย: buildnyai
- สำนักงานสิทธิบัตรยุโรป - ข้อมูลข้อความเต็มของ EP สำหรับการวิเคราะห์ข้อความ
- ชุดข้อมูลสาธารณะของ Google สิทธิบัตร: การเชื่อมต่อข้อมูลสาธารณะที่ชำระเงินและข้อมูลส่วนตัว
- ข้อมูลสิทธิบัตรโลก (WPI) - เอกสารโดเมนทางเทคนิคจากหน่วยงานจดสิทธิบัตรที่สำคัญ
- คลังข้อมูลการฆ่าล้างเผ่าพันธุ์ (GTC)
รูปแบบภาษาขนาดใหญ่และ GPT
กลับไปด้านบน
- ดูที่เก็บข้อมูลเฉพาะในแบบจำลองภาษาขนาดใหญ่ (LLMS) และ Transformers ที่ผ่านการฝึกอบรมมาแล้ว (GPTS)
- chatgpt at openai: ตัวอย่างเอกสารการกำหนดราคาการปรับแต่ง chatgpt
- ร่างสรุป chatgpt
- แบบจำลองภาษาขนาดใหญ่: รายงานโดย Ki Bundesverband
- โมเดลภาษาขนาดใหญ่: Hugging Face Report
- รายงานข้อ จำกัด ของ CHATGPT
- GPT ใช้การสอบบาร์
- รูปแบบภาษากฎหมาย
คำอธิบายประกอบและแผนการข้อมูล
กลับไปด้านบน
- แนวทางคำอธิบายประกอบสำหรับการรับรู้นิติบุคคล (เยอรมนี)
- ประเภทความหมายของบรรทัดฐานทางกฎหมาย
- แนวทางคำอธิบายประกอบสำหรับการตรวจจับขอบเขตประโยคใน Caselaw (US)
- แนวทางคำอธิบายประกอบสำหรับค่าประโยคในการตีความตามกฎหมาย (US)
- SALI: มาตรฐานอุตสาหกรรมกฎหมายสมัยใหม่
เครื่องมือคำอธิบายประกอบ
กลับไปด้านบน
- คำอธิบายประกอบข้อมูลที่ยอดเยี่ยม
- อัจฉริยะ
- Doccano
- เด็กเหลือขอ
ซอฟต์แวร์ (อินเทอร์เฟซ)
กลับไปด้านบน
- Case Law Explorer - แพลตฟอร์มซอฟต์แวร์การวิเคราะห์เครือข่ายสำหรับการวิเคราะห์การตัดสินใจของศาลชาวดัตช์และศาลยุโรป - คู่มือผู้ใช้
- ฐานข้อมูลอิเล็กทรอนิกส์เกี่ยวกับสนธิสัญญาการลงทุน (แก้ไข)
- GraphDoc - อินเทอร์เฟซกราฟิกที่ใช้งานง่ายซึ่งอนุญาตให้สร้างต้นไม้ตัดสินใจ - Codebase
- GESP - ดาวน์โหลดการตัดสินใจของศาลเยอรมันที่เปิดเผยต่อสาธารณชนทั้งหมดได้โดยตรงจากเทอร์มินัลของคุณ
กลุ่มวิจัยห้องปฏิบัติการและชุมชน
กลับไปด้านบน
- มหาวิทยาลัยสแตนฟอร์ด - Codex: ศูนย์ข้อมูลทางกฎหมายของสแตนฟอร์ด
- มหาวิทยาลัยเทคนิคแห่งมิวนิค
- มหาวิทยาลัยเทคนิคแห่งมิวนิค - กลุ่มเทคโนโลยีกฎหมาย
- Bucerius Center เกี่ยวกับวิชาชีพกฎหมาย
- โรงเรียนกฎหมายซัฟฟอล์ก - นวัตกรรมทางกฎหมายและเทคโนโลยี (LIT) ห้องปฏิบัติการ
- มหาวิทยาลัยออตตาวา - ห้องปฏิบัติการเทคโนโลยีกฎหมาย
- มหาวิทยาลัยเวียนนา - ภาควิชานวัตกรรมและดิจิทัลด้านกฎหมาย
- มหาวิทยาลัยอัมสเตอร์ดัม - ศูนย์กฎหมาย Leibniz
- มหาวิทยาลัยเฮลซิงกิ - ห้องปฏิบัติการวิจัย LegalTech
- Hofstra University - กฎหมายกฎหมายลอจิกและเทคโนโลยี
- การศึกษาด้านกฎหมายการคำนวณ
- Cirsfid-AI-มหาวิทยาลัย Bologna
- IAAIL - สมาคมระหว่างประเทศเพื่อ AI และกฎหมาย
- ASAIL - การตรวจจับอัตโนมัติการสกัดและการวิเคราะห์ข้อมูลความหมายในตำราทางกฎหมาย
- การประชุมเชิงปฏิบัติการเกี่ยวกับการประมวลผลภาษาตามธรรมชาติ: เอกสาร, โมเดล, ชุดข้อมูลและเหตุการณ์ที่เกี่ยวข้อง
- AI จีนและกฎหมาย (CAIL)
- มหาวิทยาลัยโคเปนเฮเกน, Icourts, ศูนย์วิจัยความเป็นเลิศแห่งชาติของเดนมาร์กแห่งความเป็นเลิศสำหรับศาลระหว่างประเทศ
- Maastricht Law and Tech Lab
บทเรียน
กลับไปด้านบน
- Monkey Learn - การวิเคราะห์ข้อความ
- การใช้ NLP เพื่อทำความเข้าใจกฎหมาย
- การแสดงเอกสารสำหรับข้อความทางกฎหมาย
- วิทยาศาสตร์ข้อมูลสำหรับนักกฎหมาย - แหล่งเรียนรู้
- การเข้ารหัสสำหรับนักกฎหมาย (หยุด)
- วิธีการ NLP ที่กำหนดเองเพื่อการไม่เปิดเผยตัวตนของข้อมูล
- การสกัดข้อมูลในเอกสารทางกฎหมาย
- กฎหมาย NLP: การจำแนกประโยคและ AI ที่อธิบายได้
- อภิธานศัพท์ AI ตามกฎหมาย
- ศูนย์การเรียนรู้ AI ตามกฎหมาย
การให้เครดิต
กลับไปด้านบน
ขอบคุณมากสำหรับผู้มีส่วนร่วมของเราและอีกมากมาย
งานนี้ได้รับใบอนุญาตภายใต้ใบอนุญาตสร้างสรรค์ที่มีการระบุแหล่งที่มาของคอมมอนส์ 4.0