SORSA DOWNLOAD - SORSA -Quellcode -Download

SORSA

AI-Quellcode

1.0.1

Herunterladen

SORSA: Singuläre Werte und orthonormal regulierte Singularvektoren Anpassung großer Sprachmodelle

Dieses Repository enthält die Codes von Experimenten des Papiers SORSA: Singularwerte und orthonormal regulierte Singularvektoren Adaption von Großsprachenmodellen .

Architektur von Sorsa

Der schnelle Fortschritt in Großsprachenmodellen (LLMs) hat eine signifikante Zunahme ihrer Parametergröße und stellt Herausforderungen für die Anpassung und die Feinabstimmung auf. PEFT-Methoden (Parameter-effiziente Feinabstimmungen) werden häufig verwendet, um LLMs für nachgeschaltete Aufgaben effizient anzupassen. In diesem Artikel schlagen wir einzigartige Werte und orthonormal regulierte Singularvektoren -Anpassungen oder Sorsa vor, eine neuartige PEFT -Methode. Jeder SORSA -Adapter besteht aus zwei Hauptteilen: trainierbare prinzipielle Singulargewichte $ W_p = u_p text {diag} (s_p) v^ top_p $ und gefrorene Restgewichte $ W_r = u_r text {diag} (s_r) v^ top_r $ . Diese Teile werden durch Durchführung von SVD mit vorgeborenen Gewichten initialisiert. Darüber hinaus implementieren und analysieren wir einen orthonormalen Ilegr;. SORSA -Adapter konnten während der Inferenz verschmolzen werden, wodurch jede Inferenzlatenz beseitigt wird.

Empirische Experimente

Exp

Reproduzieren die Experimente

Installieren Sie zunächst sorsa -Paket von PIP:

pip install sorsa

Erstellen Sie dann die Datei .env -Datei im Stammverzeichnis des Projekts und fügen Sie Ihr Umarmungs -Gesichts -Zugangs -Token hinzu:

hf=Your_Hugging_Face_Access_Token

Lama 2 7b, Mistral V0.1 7b und Gemma 7b

Installieren Sie zuerst die Pakete über Anaconda

conda env create -f environment.yml

Führen Sie Skripte von ./scripts/train_sorsa.sh aus, um das Modell zu trainieren.

Führen Sie nach dem Training die ./scripts/merge_sorsa.sh aus, um den Adapter zum Basismodell zusammenzuführen:

Ausführen des folgenden Befehls, um auf GSM-8K zu bewerten:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset gsm-8k 
  --test-precision bf16

Führen Sie den folgenden Befehl aus, um in Mathematik zu bewerten:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset math 
  --test-precision bf16

Führen Sie den folgenden Befehl aus, um auf Humaneval zu bewerten:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset humaneval 
  --test-precision bf16

Rwkv6

Wenn Sie das RWKV6 -Modell trainieren, zusammenführen oder testen, fügen Sie bitte das Flag --rwkv -Flag zum run.py hinzu.

Zitieren die Arbeit

Sie können die Arbeiten mit dem Bibtex -Code wie folgt zitieren:

 @article { cao2024sorsa ,
  title = { SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models } ,
  author = { Cao, Yang } ,
  journal = { arXiv preprint arXiv:2409.00055 } ,
  year = { 2024 }
}