mezo_svrg скачать - mezo_svrg исходный код скачать

mezo_svrg

AI Исходный код

1.0.0

Скачать

Mezo-SVRG: с уменьшенными дисперсией методов нулевого порядка для тонкой настройки LLMS

Этот репозиторий реализует алгоритм градиента, снижающего стохастик с нулевым приказом с нулевым порядком (Mezo-SVRG) для тонкой настройки, предварительно обученного обнимающего лица LMS. Как базовые показатели, мы также реализуем эффективную память ZO Optimizer (MEZO) и SGD первого порядка (FO-SGD). Репозиторий написан в Pytorch и использует рамку молнии Pytorch.

Установка

Для установки соответствующей среды Python используйте команду

  conda create --name zo_opt python=3.9
  conda activate zo_opt
  python -m pip install -r requirements.txt

Обзор файла

Этот репозиторий реализует алгоритм Mezo-SVRG и обеспечивает точную настройку в диапазоне на языковых моделях, используя набор данных для клея. Чтобы запустить эксперименты, выполните сценарий «finetune_llm.sh».

Сценарий поддерживает следующие модели:

'Ci-Case-Base'
'Роберта-широкий
'gpt2-xl'
'facebook/opt-2.7b'
'facebook/opt-6.7b'

Сценарий поддерживает следующие задачи клея:

Mnli
Qnli
SST-2
Кола

Укажите алгоритм тонкой настройки, передав один из следующих {'fo', 'Zo', 'Zosvrg'}. Точные настройки гиперпараметра, используемые для генерации таблиц/рисунков в статье, приведены в приложении.

Цитирование

Пожалуйста, рассмотрите возможность ссылаться на нашу статью, если вы используете наш код:

 @misc{gautam2024variancereduced,
      title={Variance-reduced Zeroth-Order Methods for Fine-Tuning Language Models}, 
      author={Tanmay Gautam and Youngsuk Park and Hao Zhou and Parameswaran Raman and Wooseok Ha},
      year={2024},
      eprint={2404.08080},
      archivePrefix={arXiv},
      primaryClass={cs.LG}
}