Скачать SORSA - Скачать исходный код SORSA

SORSA

AI Исходный код

1.0.1

Скачать

SORSA: единственные ценности и ортонормальные регуляризованные единственные векторы Адаптация крупных языковых моделей

Этот репозиторий содержит коды экспериментов по бумажной Сорсе: единственные ценности и ортонормальные регуляризованные единственные векторы адаптация крупных языковых моделей .

Архитектура Сурсы

Быстрый прогресс в моделях крупных языков (LLMS) поставляется со значительным увеличением размера их параметров, что представляет проблемы для адаптации и тонкой настройки. Методы с точной настройкой параметров (PEFT) широко используются для эффективной адаптации LLM для эффективной задачи. В этой статье мы предлагаем единственные ценности и ортонормальные регуляризованные единственные векторы адаптация, или SORSA, новый метод PEFT. Каждый адаптер SORSA состоит из двух основных частей: обучаемые основные единственные веса $ W_p = u_p text {diag} (s_p) v^ top_p $ и замороженные остаточные веса $ W_r = u_r text {diag} (s_r) v^ top_r $ Полем Эти части инициализируются путем выполнения SVD на предварительно обученных весах. Более того, мы внедряем и анализируем ортонормальный регулятор. Адаптеры SORSA могут быть объединены во время вывода, что устраняет любую задержку вывода.

Эмпирические эксперименты

Эксплуат

Воспроизведите эксперименты

Сначала установите пакет sorsa от PIP:

pip install sorsa

Затем создайте файл .env в корневом каталоге проекта и добавьте свой токен доступа к лицу:

hf=Your_Hugging_Face_Access_Token

Llama 2 7b, Mistral v0.1 7b и Gemma 7b

Сначала установите пакеты через Anaconda

conda env create -f environment.yml

Запустите сценарии от ./scripts/train_sorsa.sh для обучения модели.

После обучения запустите ./scripts/merge_sorsa.sh , чтобы объединить адаптер с базовой моделью:

Запустите следующую команду для оценки GSM-8K:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset gsm-8k 
  --test-precision bf16

Запустите следующую команду, чтобы оценить по математике:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset math 
  --test-precision bf16

Запустите следующую команду, чтобы оценить Humaneval:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset humaneval 
  --test-precision bf16

RWKV6

Если вы тренируете, слияете или тестируете модель RWKV6, пожалуйста, добавьте --rwkv Flag для run.py

Цитируйте работу

Вы можете привести работу, используя код Bibtex следующим образом:

 @article { cao2024sorsa ,
  title = { SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models } ,
  author = { Cao, Yang } ,
  journal = { arXiv preprint arXiv:2409.00055 } ,
  year = { 2024 }
}