Descarga de SORSA - Descarga del código fuente SORSA

SORSA

Código Fuente de IA

1.0.1

Descargar

SORSA: Valores singulares y Adaptación de vectores singulares regularizados ortonormales de modelos de idiomas grandes

Este repositorio contiene los códigos de experimentos del documento SORSA: valores singulares y adaptación de vectores singulares regularizados ortonormales de modelos de idiomas grandes .

Arquitectura de Sorsa

El rápido avance en los modelos de idiomas grandes (LLM) viene con un aumento significativo en el tamaño de su parámetro, presentando desafíos para la adaptación y ajuste fino. Los métodos de ajuste fino (PEFT) de parámetros se utilizan ampliamente para adaptar de manera eficiente las LLM para tareas posteriores. En este artículo, proponemos valores singulares y adaptación ortonormal de vectores singulares regularizados, o Sorsa, un nuevo método PEFF. Cada adaptador Sorsa consta de dos partes principales: Pesos singulares principales entrenables $ W_p = u_p text {diag} (s_p) v^ top_p $ y pesos residuales congelados $ W_r = u_r text {diag} (s_r) v^ top_r $ . Estas piezas se inicializan realizando SVD en pesos previamente capacitados. Además, implementamos y analizamos un regularizador ortonormal. Los adaptadores Sorsa podrían fusionarse durante la inferencia, eliminando así cualquier latencia de inferencia.

Experimentos empíricos

Expectación

Reproducir los experimentos

Primero, instale el paquete sorsa desde PIP:

pip install sorsa

Luego, cree el archivo .env en el directorio raíz del proyecto y agregue su token de acceso facial de abrazos:

hf=Your_Hugging_Face_Access_Token

Llama 2 7b, Mistral V0.1 7b y Gemma 7b

Primero, instale los paquetes a través de Anaconda

conda env create -f environment.yml

Ejecute scripts desde ./scripts/train_sorsa.sh para entrenar el modelo.

Después del entrenamiento, ejecute ./scripts/merge_sorsa.sh para fusionar el adaptador al modelo base:

Ejecute el siguiente comando para evaluar en GSM-8K:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset gsm-8k 
  --test-precision bf16

Ejecute el siguiente comando para evaluar en matemáticas:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset math 
  --test-precision bf16

Ejecute el siguiente comando para evaluar en Humaneval:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset humaneval 
  --test-precision bf16

RWKV6

Si está entrenando, fusionando o probando el modelo RWKV6, agregue --rwkv Flag a run.py

Cita el trabajo

Puede citar el trabajo utilizando el código Bibtex de la siguiente manera:

 @article { cao2024sorsa ,
  title = { SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models } ,
  author = { Cao, Yang } ,
  journal = { arXiv preprint arXiv:2409.00055 } ,
  year = { 2024 }
}

Expandir

Información adicional

Versión 1.0.1
Tipo Código Fuente de IA
Fecha de actualización 2025-09-04
tamaño 2.11MB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo