Bitune
1.0.0

Bitune: ثنائي الاتجاه تعليمات التثبيت
[ Paper ] [ Website ]
يحتوي هذا الكود المصدر على تنفيذ Bitune ، وهو يكفي لإعادة إنتاج النتائج من الورقة. يرجى ملاحظة أنه تم استخدامه لاستكشاف أفكار مختلفة ، والعديد من المكونات لها أسماء مختلفة أو تشير إلى المفاهيم غير المذكورة في الورقة.
نحن نخطط لإصدار ريبو نظيف لـ Bitune في المستقبل القريب.
يحتوي دليل lm-evaluation-harness على مستودع من Eleutherai/LM-Evaluation-Harness ، تم تكييفه مع طريقتنا. يمكنك تثبيته مع الأمر التالي:
pip install -e lm-evaluation-harnesscommon_0.sh .wandb لتسجيله. تحديث السطر 57 من eval.py مع اسم مستخدم wandb الخاص بك. instruct.sh .downstream.sh . تأكد من تعيين العدد الصحيح لخطوات التحديث (استنادًا إلى القيم الواردة في التذييل) ، وتفوق الخطوط المناسبة لاسم مجموعة البيانات ، والتقييمات (في أسفل للغاية) ، واسم الطريقة.ablations.sh وقم بتشغيل البرنامج النصي. models :pass_scale_k ، pass_scale_v ).enforce_bidir لوظيفة forward() .forward() المسؤولة عن استدعاء غلاف Bitune ._pass_fn() في ملف passes.py ):pass_scale_k ، pass_scale_v ).peft الافتراضية محولات غير نشطة على أنها غير قابلة للتجول.PassScale المحددة في models/think_gemma.py ):forward() التي تطبق عملية الخلط بناءً على المتغير المحدد في config ( config.pass_type ). يتم تعريف طريقتنا النهائية بواسطة البديل 607 (الطريقة المستخدمة للتجارب) ، ونسخه المبسطة 801 . تم استخدام الإصدارات التالية من المكتبات:
transformers==4.38.2peft==0.11.1datasets==2.18.0evaluate==0.4.0 @misc { kopiczko2024bitune ,
title = { Bitune: Bidirectional Instruction-Tuning } ,
author = { Dawid J. Kopiczko and Tijmen Blankevoort and Yuki M. Asano } ,
year = { 2024 } ,
eprint = { 2405.14862 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}