Bitune
1.0.0

Bitune: Penyetelan instruksi dua arah
[ Paper ] [ Website ]
Kode sumber ini berisi implementasi Bitune, dan cukup untuk mereproduksi hasil dari kertas. Harap dicatat bahwa itu digunakan untuk mengeksplorasi berbagai ide, dan banyak komponen memiliki nama yang berbeda atau merujuk pada konsep yang tidak disebutkan dalam makalah.
Kami berencana untuk merilis repo bersih untuk Bitune dalam waktu dekat.
Direktori lm-evaluation-harness berisi repositori dari Eleutherai/LM-Evaluasi-Harness, disesuaikan dengan metode kami. Anda dapat menginstalnya dengan perintah berikut:
pip install -e lm-evaluation-harnesscommon_0.sh .wandb untuk penebangan. Perbarui baris 57 dari eval.py dengan nama pengguna wandb Anda. instruct.sh .downstream.sh . Pastikan untuk mengatur jumlah langkah pembaruan yang benar (berdasarkan nilai -nilai yang disediakan dalam Lampiran), dan Batalkan Komentari baris yang sesuai untuk nama dataset, evaluasi (di bagian paling bawah), dan nama metode.ablations.sh dan jalankan skrip. models :pass_scale_k , pass_scale_v ).enforce_bidir dari Fungsi forward() .forward() yang bertanggung jawab untuk memanggil pembungkus Bitune ._pass_fn() di file passes.py ):pass_scale_k , pass_scale_v ).peft menetapkan adaptor tidak aktif sebagai tidak dapat dilatih.PassScale yang didefinisikan dalam models/think_gemma.py ):forward() yang menerapkan operasi pencampuran berdasarkan varian yang ditentukan dalam config ( config.pass_type ). Metode terakhir kami ditentukan oleh varian 607 (yang digunakan untuk percobaan), dan versi 801 yang disederhanakan. Versi perpustakaan berikut telah digunakan:
transformers==4.38.2peft==0.11.1datasets==2.18.0evaluate==0.4.0 @misc { kopiczko2024bitune ,
title = { Bitune: Bidirectional Instruction-Tuning } ,
author = { Dawid J. Kopiczko and Tijmen Blankevoort and Yuki M. Asano } ,
year = { 2024 } ,
eprint = { 2405.14862 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}