Lexnlp oleh lexpredict
Pengambilan Informasi dan Ekstraksi untuk teks hukum yang nyata dan tidak terstruktur
LexNLP adalah perpustakaan untuk bekerja dengan teks hukum yang nyata dan tidak terstruktur, termasuk kontrak, rencana, kebijakan, prosedur, dan materi lainnya.
LexNLP menyediakan fungsionalitas seperti:
- Segmentasi dan tokenisasi, seperti
- Parser kalimat yang menyadari singkatan hukum umum seperti LLC. atau f.3d.
- Model segmentasi pra-terlatih untuk konsep hukum seperti halaman atau bagian.
- Model penyematan kata pra-terlatih dan topik, secara luas dan untuk bidang praktik tertentu
- Klasifikasi pra-terlatih untuk jenis dokumen dan jenis klausa
- Rentang ekstraksi fakta yang luas, seperti:
- Jumlah moneter, jumlah non-moneter, persentase, rasio
- Pernyataan dan kendala bersyarat, seperti "kurang dari" atau "lebih lambat dari"
- Tanggal, Tanggal Berulang, dan Durasi
- Pengadilan, peraturan, dan kutipan
- Alat untuk membangun metode pengelompokan dan klasifikasi baru
- Ratusan tes unit dari dokumen hukum nyata
Informasi
- ContraxSuite: https://contraxsuite.com/
- LEXPREDICT: https://lexpredict.com/
- Situs web resmi: https://lexnlp.com/
- Dokumentasi: http://lexpredict-lexnlp.readthedocs.io/en/latest/ (sedang berlangsung)
- Hubungi: [email protected]
Struktur
- Aplikasi Web ContraxSuite: https://github.com/lexpredict/lexpredict-contraxSuite
- Perpustakaan Lexnlp untuk Ekstraksi: https://github.com/lexpredict/lexpredict-lexnlp
- ContraxSuite Model Pra-Latih dan "Set Pengetahuan": https://github.com/lexpredict/lexpredict-legal-dictionary
- Sampel Perjanjian ContraxSuite: https://github.com/lexpredict/lexpredict-contraxSuite-samples
- Otomasi Penyebaran ContraxSuite: https://github.com/lexpredict/lexpredict-contraxSuite-deploy Harap dicatat bahwa instalasi contraxSuite umumnya memerlukan model terlatih atau set pengetahuan untuk penggunaan.
Lisensi
LexNLP tersedia di bawah model lisensi ganda. Secara default, perpustakaan ini dapat digunakan dalam istilah AGPLV3 sebagaimana dirinci dalam file lisensi repositori; Namun, organisasi dapat meminta rilis dari ketentuan AGPL atau lisensi evaluasi non-GPL dengan menghubungi lisensi ContraxSuite di <[email protected]>.
Persyaratan
Pelepasan
- 2.3.0: 30 November 2022 - rilis publik yang dijadwalkan keenam; kode
- 2.2.1.0: 10 Agustus 2022 - rilis publik yang dijadwalkan kedua puluh lima; kode
- 2.2.0: 7 Juli 2022 - Rilis publik yang dijadwalkan keempat; kode
- 2.1.0: 16 September 2021 - Rilis publik yang dijadwalkan dua puluh ketiga; kode
- 2.0.0: 10 Mei 2021 - Rilis publik yang dijadwalkan dua puluh detik; kode
- 1.8.0: 2 Desember 2020 - Dua puluh rilis publik yang dijadwalkan pertama; kode
- 1.7.0: 27 Agustus 2020 - Rilis publik yang dijadwalkan kedua puluh; kode
- 1.6.0: 27 Mei 2020 - Rilis publik yang dijadwalkan kesembilan belas; kode
- 1.4.0: 20 Desember 2019 - Rilis publik yang dijadwalkan kedelapan belas; kode
- 1.3.0: 1 November 2019 - Rilis publik yang dijadwalkan ketujuh belas; kode
- 0.2.7: 1 Agustus 2019 - Rilis publik yang dijadwalkan keenam belas; kode
- 0.2.6: 12 Juni 2019 - Rilis publik terjadwal kelima belas; kode
- 0.2.5: 1 Maret 2019 - Rilis publik terjadwal keempat belas; kode
- 0.2.4: 1 Februari 2019 - Rilis publik yang dijadwalkan ketiga belas; kode
- 0.2.3: 10 Junuary 2019 - Rilis Publik Terjadwal Keduabelas; kode
- 0.2.2: 30 September 2018 - Rilis publik terjadwal kesebelas; kode
- 0.2.1: 24 Agustus 2018 - Rilis publik yang dijadwalkan kesepuluh; kode
- 0.2.0: 1 Agustus 2018 - Rilis publik yang dijadwalkan kesembilan; kode
- 0.1.9: 1 Juli 2018 - Rilis publik yang dijadwalkan kesembilan; kode
- 0.1.8: 1 Mei 2018 - Rilis publik yang dijadwalkan kedelapan; kode
- 0.1.7: 1 April 2018 - Rilis publik yang dijadwalkan ketujuh; kode
- 0.1.6: 1 Maret 2018 - Rilis publik yang dijadwalkan keenam; kode
- 0.1.5: 1 Februari 2018 - Rilis publik yang dijadwalkan kelima; kode
- 0.1.4: 1 Januari 2018 - Rilis publik terjadwal keempat; kode
- 0.1.3: 1 Desember 2017 - Rilis publik terjadwal ketiga; kode
- 0.1.2: 1 November 2017 - Rilis publik terjadwal kedua; kode
- 0.1.1: 2 Oktober 2017 - Rilis perbaikan bug untuk 0.1.0; kode
- 0.1.0: 30 September 2017 - Rilis publik pertama; kode