QLoRA Fine tuning for Film Character Styled Responses from LLM
1.0.0
รหัสสำหรับการปรับแต่ง LLAMA2 LLM พร้อมชุดข้อมูลข้อความที่กำหนดเองเพื่อสร้างการตอบสนองสไตล์ตัวละครฟิล์ม
รหัสนี้ใช้พารามิเตอร์ Qlora ที่มีประสิทธิภาพในการปรับแต่ง Llama2 LLM ที่ปรับแต่งได้ซึ่งสามารถส่งคืนการตอบกลับในรูปแบบของแกนดัล์ฟจากลอร์ดออฟเดอะริงส์
get_gandalf_data.py - webscrapes ข้อมูลการสนทนาข้อความ Gandalf จากแหล่งข้อมูลออนไลน์
gandalf_dataset.py - สร้างชุดข้อมูลการสืบค้น/การตอบกลับจาก gandalf.csv ซึ่งสร้างขึ้นจากข้อมูลการสนทนา webscraped
hyper_params.py - กำหนด hyperparameters สำหรับลูปฝึกอบรม
Train_gandalf.py - รุ่น Base Base Llama2 ที่มีชุดข้อมูล Gandalf ที่กำหนดเองโดยใช้เทคนิค Qlora Peft
Evaluate.py - โหลดโมเดล Llama2 ที่ปรับแต่งอย่างละเอียดและสร้างการตอบสนองสไตล์แกนดัลฟ์เพื่อรับข้อความอินพุต
Louis Chapo-Saunders