Download de SORSA - Download de código fonte de SORSA

SORSA

Código-Fonte de IA

1.0.1

Baixar

Sorsa: valores singulares e vetores singulares regularizados ortonormes adaptação de grandes modelos de linguagem

Este repositório contém os códigos de experimentos do artigo Sorsa: valores singulares e vetores singulares regularizados ortonormais adaptação de grandes modelos de linguagem .

Arquitetura de Sorsa

O rápido avanço em grandes modelos de idiomas (LLMS) vem com um aumento significativo no tamanho do parâmetro, apresentando desafios para adaptação e ajuste fino. Os métodos de ajuste fino (PEFT) com eficiência de parâmetro são amplamente utilizados para adaptar os LLMs para tarefas a jusante com eficiência. Neste artigo, propomos valores singulares e adaptação ortomal de vetores singulares regularizados, ou Sorsa, um novo método PEFT. Cada adaptador Sorsa consiste em duas partes principais: pesos singulares principais treináveis $ W_p = u_p text {diag} (s_p) v^ top_p $ e pesos residuais congelados $ W_r = u_r text {diag} (s_r) v^ top_r $ . Essas peças são inicializadas executando SVD em pesos pré-treinados. Além disso, implementamos e analisamos um regularizador ortonormal. Os adaptadores de Sorsa podem ser mesclados durante a inferência, eliminando assim qualquer latência de inferência.

Experimentos empíricos

Exp

Reproduzir os experimentos

Primeiro, instale o pacote sorsa a partir de Pip:

pip install sorsa

Em seguida, crie o arquivo .env no diretório raiz do projeto e adicione seu token de acesso à face abraça:

hf=Your_Hugging_Face_Access_Token

LLAMA 2 7B, MISTRAL V0.1 7B e GEMMA 7B

Primeiro, instale os pacotes via Anaconda

conda env create -f environment.yml

Execute scripts de ./scripts/train_sorsa.sh para treinar o modelo.

Após o treinamento, execute o ./scripts/merge_sorsa.sh para mesclar o adaptador ao modelo básico:

Execute o seguinte comando para avaliar no GSM-8K:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset gsm-8k 
  --test-precision bf16

Execute o seguinte comando para avaliar em matemática:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset math 
  --test-precision bf16

Execute o seguinte comando para avaliar no Humaneval:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset humaneval 
  --test-precision bf16

Rwkv6

Se você estiver treinando, mesclando ou testando o modelo RWKV6, adicione --rwkv FLAG para run.py

Citar o trabalho

Você pode citar o trabalho usando o código Bibtex da seguinte forma:

 @article { cao2024sorsa ,
  title = { SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models } ,
  author = { Cao, Yang } ,
  journal = { arXiv preprint arXiv:2409.00055 } ,
  year = { 2024 }
}

Expandir

Informações adicionais

Versão 1.0.1
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-04
tamanho 2.11MB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos