Lawmate Romania هو مشروع يركز على إنشاء نموذج لغة كبير (LLM) متخصص في المجال القانوني الروماني. تم تصميم هذا النموذج للمساعدة في مختلف المهام القانونية من خلال فهم وإنشاء نص على أساس الوثائق القانونية الرومانية. يستخدم المشروع نموذج Equall/Saul-7B-instruct-V1 الذي تم تدريبه مسبقًا من مكتبة Hugging Face ، وتحديداً تم ضبطه على النصوص القانونية الرومانية مثل الدستور وقانون التعليم.
documents/ : يحتوي على مستندات نصية تستخدم لتدريب النموذج ، بما في ذلك الدستور الروماني وقانون التعليم.
training_ds/ : يحتوي على ملفات مجموعة البيانات التي تم إنشاؤها من المستندات النصية لأغراض التدريب.
env_llm.txt : يسرد التبعيات وإعدادات البيئة المطلوبة لتشغيل المشروع.
main.py : البرنامج النصي الرئيسي لتدريب وتقييم نموذج اللغة الكبير (LLM).
.gitignore
LawMate Romania/ : يتضمن نص chatbot ولقطات شاشة توضح التفاعلات على سبيل المثال.
قم بإعداد البيئة :
pip install -r env_llm.txtقم بإعداد ملفات PDF :
documents/ الدليل.صقل النموذج :
main.py لضبط LLM المدربة مسبقًا على مجموعة البيانات المقدمة.تقييم وحفظ النموذج :