Lawmate Romania adalah proyek yang berfokus pada menciptakan model bahasa besar (LLM) yang berspesialisasi dalam domain hukum Rumania. Model ini dirancang untuk membantu dengan berbagai tugas hukum dengan memahami dan menghasilkan teks berdasarkan dokumen hukum Rumania. Proyek ini menggunakan model pra-terlatih yang sama-sama/SAUL-7b-instruct-V1 dari Perpustakaan Memeluk Face, khususnya disesuaikan dengan teks-teks hukum Rumania seperti Konstitusi dan Undang-Undang Pendidikan.
documents/ : Berisi dokumen teks yang digunakan untuk melatih model, termasuk Konstitusi Rumania dan undang -undang pendidikan.
training_ds/ : Berisi file dataset yang dihasilkan dari dokumen teks untuk tujuan pelatihan.
env_llm.txt : Daftar dependensi dan pengaturan lingkungan yang diperlukan untuk menjalankan proyek.
main.py : Skrip utama untuk pelatihan dan evaluasi model bahasa besar (LLM).
.gitignore : Menentukan file dan direktori yang harus diabaikan oleh git agar repositori tetap bersih.
LawMate Romania/ : Termasuk skrip chatbot dan tangkapan layar yang menunjukkan interaksi contoh.
Siapkan lingkungan :
pip install -r env_llm.txtSiapkan file PDF :
documents/ Direktori.Menyempurnakan model :
main.py untuk menyempurnakan LLM yang sudah terlatih pada dataset yang disediakan.Evaluasi dan simpan model :