download mezo_svrg - mezo_svrg download de código fonte

mezo_svrg

Código-Fonte de IA

1.0.0

Baixar

Mezo-SVRG: Métodos de ordem zero reduzidos à variância para LLMs de ajuste fino

Este repositório implementa o algoritmo de gradiente de Gradiente (Mezo-SVRG) com eficiência de Memória com Eficiência Zeroth (MEZO-SVRG) para o rosto de abraço pré-treinado, LMS. Como linhas de base, também implementamos o Optimizador ZO (MEZO) com eficiência de memória e MEZO) e SGD de primeira ordem (FO-SGD). O repositório é escrito em Pytorch e aproveita a estrutura Pytorch Lightning.

Instalação

Para instalar o ambiente Python relevante, use o comando

  conda create --name zo_opt python=3.9
  conda activate zo_opt
  python -m pip install -r requirements.txt

Visão geral do arquivo

Esse repositório implementa o algoritmo Mezo-SVRG e permite ajustes finos em um intervalo em modelos de idiomas usando o conjunto de dados de referência de cola. Para executar experimentos, execute o script 'Finetune_llm.sh'.

O script suporta os seguintes modelos:

'Distilbert-baseado'
'Roberta-Large'
'Gpt2-xl'
'Facebook/opt-2.7b'
'Facebook/Opt-6.7b'

O script suporta as seguintes tarefas de cola:

Mnli
Qnli
SST-2
Cola

Indique o algoritmo de ajuste fino, passando um dos seguintes {'fo', 'zo', 'zosvrg'}. As configurações exatas de hiperparâmetro usadas para gerar as tabelas/figuras no papel são fornecidas no apêndice.

Citação

Por favor, considere citar nosso artigo se você usar nosso código:

 @misc{gautam2024variancereduced,
      title={Variance-reduced Zeroth-Order Methods for Fine-Tuning Language Models}, 
      author={Tanmay Gautam and Youngsuk Park and Hao Zhou and Parameswaran Raman and Wooseok Ha},
      year={2024},
      eprint={2404.08080},
      archivePrefix={arXiv},
      primaryClass={cs.LG}
}