LLM-Recommendation-Systems
การปรับแต่ง LLMS สำหรับคำแนะนำที่ใช้ข้อความ
โครงการนี้สำรวจศักยภาพของการปรับแต่งแบบจำลองภาษาขนาดใหญ่ (LLMs) โดยเฉพาะสำหรับคำแนะนำที่ใช้ข้อความโดยมีวัตถุประสงค์เพื่อปรับปรุงความแม่นยำและความพึงพอใจของผู้ใช้ มันแนะนำกลไกที่แปลกใหม่ที่เปลี่ยนข้อมูลความสัมพันธ์เป็นข้อความภาษาธรรมชาติทำให้ LLM สามารถตีความการโต้ตอบของผู้ใช้และให้คำแนะนำที่มีข้อมูลมากขึ้น
ภาพรวมโครงการ
ประเด็นสำคัญ:
- ใช้ชุดข้อมูลรีวิว Amazon 2018 เพื่อพัฒนาระบบแนะนำผลิตภัณฑ์ส่วนบุคคล
- ดำเนินการและเปรียบเทียบประสิทธิภาพของแบบจำลองภาษาขนาดใหญ่สองแบบ: Mistral-7b และ Tinyllama
- เทคนิคขั้นสูงที่ใช้เช่น LORA (การปรับระดับต่ำ) และ Qlora (LORA เชิงปริมาณ) สำหรับการปรับแต่งแบบจำลองที่มีประสิทธิภาพ
- พัฒนากลยุทธ์การแจ้งเตือนใหม่เพื่อเปลี่ยนประวัติการโต้ตอบของผู้ใช้เป็นอินพุตภาษาธรรมชาติสำหรับโมเดล
- ได้รับความแม่นยำมากกว่า 98% ในการทำนายการซื้อผลิตภัณฑ์ครั้งต่อไปของผู้ใช้โดยใช้โมเดล Tinyllama ที่ปรับแต่งได้อย่างละเอียด
- แสดงให้เห็นว่ารุ่นที่เล็กกว่าและพิเศษสามารถทำได้ดีกว่ารุ่นที่มีขนาดใหญ่กว่าสำหรับงานที่เฉพาะเจาะจงเมื่อปรับแต่งอย่างเหมาะสม
- ดำเนินการวิเคราะห์ข้อผิดพลาดเพื่อระบุรูปแบบในการคาดการณ์ที่ไม่ถูกต้องและพื้นที่ที่มีศักยภาพสำหรับการปรับปรุง
- สำรวจความสมดุลระหว่างขนาดของแบบจำลองประสิทธิภาพการคำนวณและความแม่นยำในการทำนายในระบบแนะนำ
โครงการมุ่งเน้นไปที่การแสดงให้เห็นถึงประสิทธิภาพของการปรับจูน LLMs สำหรับงานแนะนำโดยใช้ชุดข้อมูลที่หลากหลายและกว้างขวาง การดำเนินการรวมถึงขั้นตอนต่อไปนี้:
การสกัดข้อมูลและการประมวลผลล่วงหน้า :
- สกัดข้อมูลย่อยของข้อมูลการตรวจสอบของ Amazon และแปลงเป็น dataframes
- ลบคอลัมน์ที่ไม่จำเป็น
- กรองผู้ใช้ที่มีประวัติการซื้อไม่เพียงพอ
- แปลงข้อมูลที่เหลือเป็นพรอมต์สร้างอินพุตสำหรับ LLM
วิศวกรรมที่รวดเร็ว :
- สำรวจเทคนิคการแจ้งเตือนต่าง ๆ
- ตัดสินบนโครงสร้างสามส่วนสำหรับแต่ละพรอมต์: คำสั่ง, รายละเอียดการป้อนข้อมูลและเอาต์พุตความจริงภาคพื้นดิน
- โครงสร้างนี้ให้แบบจำลองที่มีงานที่ชัดเจนข้อมูลที่เกี่ยวข้องและรูปแบบเอาต์พุตที่ต้องการ
การใช้งานแบบจำลอง :
- ใช้ไลบรารี AI และ HuggingFace ที่ไม่ได้ใช้งานสำหรับโมเดลที่ผ่านการฝึกอบรมมาก่อนและเครื่องมือปรับแต่ง
- ถือว่าเป็น Qlora ซึ่งเป็นเทคนิคในการปรับปรุงประสิทธิภาพของโมเดล
- สร้าง
SFTTrainer รวมและ TrainingArguments วัตถุเพื่อรวมศูนย์การปรับพารามิเตอร์ไฮเปอร์พารามิเตอร์ในระหว่างการฝึกอบรม