Bitune
1.0.0

Bitune: การปรับแต่งคำสั่งแบบสองทิศทาง
[ Paper ] [ Website ]
ซอร์สโค้ดนี้มีการใช้บิตทูนและเพียงพอที่จะทำซ้ำผลลัพธ์จากกระดาษ โปรดทราบว่ามันถูกใช้เพื่อสำรวจความคิดที่แตกต่างกันและส่วนประกอบจำนวนมากมีชื่อที่แตกต่างกันหรืออ้างถึงแนวคิดที่ไม่ได้กล่าวถึงในบทความ
เราวางแผนที่จะปล่อย Repo ที่สะอาดสำหรับ Bitune ในอนาคตอันใกล้
ไดเรกทอรี lm-evaluation-harness ประกอบด้วยที่เก็บจาก Eleutherai/LM-Evaluation-Harness ปรับให้เข้ากับวิธีการของเรา คุณสามารถติดตั้งด้วยคำสั่งต่อไปนี้:
pip install -e lm-evaluation-harnesscommon_0.shwandb สำหรับการบันทึก อัปเดตบรรทัด 57 ของ eval.py ด้วยชื่อผู้ใช้ wandb ของคุณ instruct.shdownstream.sh ตรวจสอบให้แน่ใจว่าได้ตั้งค่าจำนวนขั้นตอนการอัปเดตที่ถูกต้อง (ขึ้นอยู่กับค่าที่ให้ไว้ในภาคผนวก) และยกเลิกการยกเลิกบรรทัดที่เหมาะสมสำหรับชื่อชุดข้อมูลการประเมิน (ที่ด้านล่างสุด) และชื่อวิธีablations.sh และเรียกใช้สคริปต์ models :pass_scale_k , pass_scale_v )enforce_bidir ของฟังก์ชัน forward()forward() ที่รับผิดชอบในการเรียก bitune wrapper_pass_fn() ในไฟล์ passes.py ):pass_scale_k , pass_scale_v )peft เริ่มต้นตั้งค่าอะแดปเตอร์ที่ไม่ได้ใช้งานว่าไม่สามารถผ่านการฝึกได้PassScale คลาสที่กำหนดใน models/think_gemma.py ):forward() ที่ใช้การทำงานผสมตามตัวแปรที่ระบุใน config ( config.pass_type ) วิธีสุดท้ายของเราถูกกำหนดโดยตัวแปร 607 (วิธีที่ใช้สำหรับการทดลอง) และเวอร์ชันที่เรียบง่าย 801 มีการใช้ไลบรารีเวอร์ชันต่อไปนี้:
transformers==4.38.2peft==0.11.1datasets==2.18.0evaluate==0.4.0 @misc { kopiczko2024bitune ,
title = { Bitune: Bidirectional Instruction-Tuning } ,
author = { Dawid J. Kopiczko and Tijmen Blankevoort and Yuki M. Asano } ,
year = { 2024 } ,
eprint = { 2405.14862 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}