Téléchargement de SORSA - Téléchargement du code source SORSA

SORSA

Code Source AI

1.0.1

Télécharger

SORSA: Valeurs singulières et vecteurs singuliers régularisés orthonormaux Adaptation des modèles de grands langues

Ce référentiel contient les codes d'expériences du papier SORSA: valeurs singulières et adaptations singulières régularisées orthonormales de modèles de grands langues .

Architecture de Sorsa

L'avancement rapide dans les modèles de grands langues (LLMS) est livré avec une augmentation significative de la taille de leur paramètre, présentant des défis pour l'adaptation et le réglage fin. Les méthodes de réglage fin et économes par les paramètres (PEFT) sont largement utilisées pour adapter efficacement les LLM pour les tâches en aval. Dans cet article, nous proposons des valeurs singulières et une adaptation des vecteurs singuliers régularisés orthonormaux, ou Sorsa, une nouvelle méthode PEFT. Chaque adaptateur SORSA se compose de deux parties principales: des poids singuliers principaux formables $ W_p = u_p text {diag} (s_p) v ^ top_p $ et des poids résiduels gelés $ W_r = u_r text {diag} (s_r) v ^ top_r $ . Ces pièces sont initialisées en effectuant un SVD sur des poids pré-entraînés. De plus, nous mettons en œuvre et analysons un régulariseur orthonormal. Les adaptateurs SORSA pourraient être fusionnés pendant l'inférence, éliminant ainsi toute latence d'inférence.

Expériences empiriques

Exp

Reproduire les expériences

Tout d'abord, installez le package sorsa depuis PIP:

pip install sorsa

Ensuite, créez un fichier .env dans le répertoire racine du projet et ajoutez votre jeton d'accès à face étreint:

hf=Your_Hugging_Face_Access_Token

LLAMA 2 7B, Mistral V0.1 7b et Gemma 7b

Tout d'abord, installez les packages via Anaconda

conda env create -f environment.yml

Exécutez des scripts de ./scripts/train_sorsa.sh pour former le modèle.

Après l'entraînement, exécutez le ./scripts/merge_sorsa.sh pour fusionner l'adaptateur au modèle de base:

Exécutez la commande suivante pour évaluer sur GSM-8K:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset gsm-8k 
  --test-precision bf16

Exécutez la commande suivante pour évaluer les mathématiques:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset math 
  --test-precision bf16

Exécutez la commande suivante pour évaluer sur Humaneval:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset humaneval 
  --test-precision bf16

Rwkv6

Si vous entraînez, fusionnez ou testez le modèle RWKV6, veuillez ajouter --rwkv indicateur pour run.py

Citer le travail

Vous pouvez citer le travail en utilisant le code Bibtex comme suit:

 @article { cao2024sorsa ,
  title = { SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models } ,
  author = { Cao, Yang } ,
  journal = { arXiv preprint arXiv:2409.00055 } ,
  year = { 2024 }
}

Développer

Informations supplémentaires

Version 1.0.1
Type Code Source AI
Date de mise à jour 2025-09-04
taille 2.11MB
Provenant de Github

Applications connexes

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout