ผู้ร่างกฎหมายโรมาเนียเป็นโครงการที่มุ่งเน้นการสร้างรูปแบบภาษาขนาดใหญ่ (LLM) ที่เชี่ยวชาญในโดเมนกฎหมายของโรมาเนีย โมเดลนี้ออกแบบมาเพื่อช่วยเหลืองานทางกฎหมายที่หลากหลายโดยการทำความเข้าใจและสร้างข้อความตามเอกสารทางกฎหมายของโรมาเนีย โครงการใช้โมเดลที่ได้รับการฝึกอบรมล่วงหน้า Equall/SAUL-7B-Instruct-V1 จากห้องสมุดของ Hugging Face โดยเฉพาะปรับแต่งเกี่ยวกับตำราทางกฎหมายของโรมาเนียเช่นรัฐธรรมนูญและกฎหมายการศึกษา
documents/ : มีเอกสารข้อความที่ใช้สำหรับการฝึกอบรมแบบจำลองรวมถึงรัฐธรรมนูญของโรมาเนียและกฎหมายการศึกษา
training_ds/ : มีไฟล์ชุดข้อมูลที่สร้างขึ้นจากเอกสารข้อความเพื่อวัตถุประสงค์ในการฝึกอบรม
env_llm.txt : แสดงรายการการพึ่งพาและการตั้งค่าสภาพแวดล้อมที่จำเป็นในการเรียกใช้โครงการ
main.py : สคริปต์หลักสำหรับการฝึกอบรมและประเมินรูปแบบภาษาขนาดใหญ่ (LLM)
.gitignore : ระบุไฟล์และไดเรกทอรีที่จะถูกละเว้นโดย Git เพื่อให้พื้นที่เก็บข้อมูลสะอาด
LawMate Romania/ : รวมถึงสคริปต์ chatbot และภาพหน้าจอแสดงให้เห็นถึงการโต้ตอบตัวอย่าง
ตั้งค่าสภาพแวดล้อม :
pip install -r env_llm.txtเตรียมไฟล์ PDF :
documents/ ไดเรกทอรีปรับแต่งโมเดล :
main.py เพื่อปรับแต่ง LLM ที่ผ่านการฝึกอบรมล่วงหน้าบนชุดข้อมูลที่ให้ไว้ประเมินและบันทึกแบบจำลอง :