mezo_svrg Download - mezo_svrg Kode Sumber Unduh

mezo_svrg

Kode Sumber AI

1.0.0

Unduh

Mezo-SVRG: metode nol-orde yang dikurangi varians untuk fine-tuning llms

Repositori ini mengimplementasikan algoritma gradien varians-reduced-order-orde-orde-orde-order (MEZO-SVRG) untuk menyempurnakan LM FACE HUKGGING FACE. Sebagai baselines, kami juga menerapkan ZO Optimizer (MEZO) dan SGD orde pertama (FO-SGD). Repositori ditulis dalam Pytorch dan memanfaatkan kerangka kerja Pytorch Lightning.

Instalasi

Untuk menginstal lingkungan Python yang relevan, gunakan perintah

  conda create --name zo_opt python=3.9
  conda activate zo_opt
  python -m pip install -r requirements.txt

Tinjauan File

Repositori ini mengimplementasikan algoritma mezo-SVRG dan memungkinkan penyesuaian pada rentang model bahasa menggunakan dataset patokan lem. Untuk menjalankan eksperimen, jalankan skrip bash 'finetune_llm.sh'.

Skrip mendukung model berikut:

'Distilbert-Base-Cased'
'Roberta-Large'
'gpt2-xl'
'Facebook/opt-2.7b'
'Facebook/opt-6.7b'

Skrip mendukung tugas lem berikut:

Mnli
Qnli
SST-2
Cola

Tunjukkan algoritma penyempurnaan dengan melewati salah satu dari {'fo', 'zo', 'zosvrg'}. Pengaturan hyperparameter yang tepat yang digunakan untuk menghasilkan tabel/angka dalam kertas disediakan dalam lampiran.

Kutipan

Harap pertimbangkan mengutip makalah kami jika Anda menggunakan kode kami:

 @misc{gautam2024variancereduced,
      title={Variance-reduced Zeroth-Order Methods for Fine-Tuning Language Models}, 
      author={Tanmay Gautam and Youngsuk Park and Hao Zhou and Parameswaran Raman and Wooseok Ha},
      year={2024},
      eprint={2404.08080},
      archivePrefix={arXiv},
      primaryClass={cs.LG}
}