Repositori ini mengimplementasikan algoritma gradien varians-reduced-order-orde-orde-orde-order (MEZO-SVRG) untuk menyempurnakan LM FACE HUKGGING FACE. Sebagai baselines, kami juga menerapkan ZO Optimizer (MEZO) dan SGD orde pertama (FO-SGD). Repositori ditulis dalam Pytorch dan memanfaatkan kerangka kerja Pytorch Lightning.
Untuk menginstal lingkungan Python yang relevan, gunakan perintah
conda create --name zo_opt python=3.9
conda activate zo_opt
python -m pip install -r requirements.txtRepositori ini mengimplementasikan algoritma mezo-SVRG dan memungkinkan penyesuaian pada rentang model bahasa menggunakan dataset patokan lem. Untuk menjalankan eksperimen, jalankan skrip bash 'finetune_llm.sh'.
Skrip mendukung model berikut:
Skrip mendukung tugas lem berikut:
Tunjukkan algoritma penyempurnaan dengan melewati salah satu dari {'fo', 'zo', 'zosvrg'}. Pengaturan hyperparameter yang tepat yang digunakan untuk menghasilkan tabel/angka dalam kertas disediakan dalam lampiran.
Harap pertimbangkan mengutip makalah kami jika Anda menggunakan kode kami:
@misc{gautam2024variancereduced,
title={Variance-reduced Zeroth-Order Methods for Fine-Tuning Language Models},
author={Tanmay Gautam and Youngsuk Park and Hao Zhou and Parameswaran Raman and Wooseok Ha},
year={2024},
eprint={2404.08080},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
Lihat berkontribusi untuk informasi lebih lanjut.
Proyek ini dilisensikan di bawah lisensi APACHE-2.0.