SORSA Download - SORSA Source Source Download

SORSA

โค้ดแหล่งที่มา AI

1.0.1

ดาวน์โหลด

Sorsa: ค่าเอกพจน์และการปรับตัวของเวกเตอร์เอกพจน์แบบออร์โธนัลเป็นปกติของแบบจำลองภาษาขนาดใหญ่

พื้นที่เก็บข้อมูลนี้มีรหัสของการทดลองของกระดาษ Sorsa: ค่าเอกพจน์และการปรับเวกเตอร์เอกพจน์แบบออร์โธนตามปกติของแบบจำลองภาษาขนาดใหญ่

สถาปัตยกรรมของ Sorsa

ความก้าวหน้าอย่างรวดเร็วในรูปแบบภาษาขนาดใหญ่ (LLMS) มาพร้อมกับการเพิ่มขนาดพารามิเตอร์ของพวกเขาอย่างมีนัยสำคัญนำเสนอความท้าทายสำหรับการปรับตัวและการปรับแต่ง วิธีการปรับแต่งพารามิเตอร์การปรับจูน (PEFT) นั้นใช้กันอย่างแพร่หลายในการปรับ LLMs สำหรับงานดาวน์สตรีมได้อย่างมีประสิทธิภาพ ในบทความนี้เราเสนอค่าเอกพจน์และการปรับตัวของเวกเตอร์แบบเอกพจน์แบบออร์โธนอลหรือ Sorsa ซึ่งเป็นวิธี PEFT แบบใหม่ อะแดปเตอร์ Sorsa แต่ละตัวประกอบด้วยสองส่วนหลัก: น้ำหนักเอกพจน์หลักฝึกอบรมได้ $ w_p = u_p text {diag} (s_p) v^ top_p $ และน้ำหนักที่เหลือแช่แข็ง $ w_r = u_r text {diag} (s_r) v^ top_r $ - ชิ้นส่วนเหล่านี้จะเริ่มต้นโดยการทำ SVD บนน้ำหนักที่ได้รับการฝึกอบรมมาก่อน ยิ่งกว่านั้นเรานำไปใช้และวิเคราะห์ orthonormal onoumizer อะแดปเตอร์ Sorsa สามารถรวมเข้าด้วยกันในระหว่างการอนุมานจึงกำจัดเวลาแฝงการอนุมานใด ๆ

การทดลองเชิงประจักษ์

ค่าใช้จ่าย

ทำซ้ำการทดลอง

ก่อนอื่นให้ติดตั้งแพ็คเกจ sorsa จาก PIP:

pip install sorsa

จากนั้นสร้างไฟล์ .env ในไดเรกทอรีรากของโครงการและเพิ่มโทเค็นการเข้าถึงใบหน้าของคุณ:

hf=Your_Hugging_Face_Access_Token

LLAMA 2 7B, MISTRAL V0.1 7B และ GEMMA 7B

ก่อนอื่นให้ติดตั้งแพ็คเกจผ่าน Anaconda

conda env create -f environment.yml

เรียกใช้สคริปต์จาก ./scripts/train_sorsa.sh เพื่อฝึกอบรมโมเดล

หลังจากการฝึกอบรมให้เรียกใช้ ./scripts/merge_sorsa.sh เพื่อรวมอะแดปเตอร์เข้ากับโมเดลพื้นฐาน:

เรียกใช้คำสั่งต่อไปนี้เพื่อประเมินบน GSM-8K:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset gsm-8k 
  --test-precision bf16

เรียกใช้คำสั่งต่อไปนี้เพื่อประเมินทางคณิตศาสตร์:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset math 
  --test-precision bf16

เรียกใช้คำสั่งต่อไปนี้เพื่อประเมินเกี่ยวกับ HumanEval:

python3 run.py --name llama2_sorsa_r128 
  --test 
  --test-dataset humaneval 
  --test-precision bf16

RWKV6

หากคุณกำลังฝึกอบรมการรวมหรือทดสอบรุ่น RWKV6 โปรดเพิ่ม --rwkv Flag เพื่อ run.py

อ้างถึงงาน

คุณสามารถอ้างอิงงานได้โดยใช้รหัส BIBTEX ดังนี้:

 @article { cao2024sorsa ,
  title = { SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models } ,
  author = { Cao, Yang } ,
  journal = { arXiv preprint arXiv:2409.00055 } ,
  year = { 2024 }
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.1
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-04
ขนาด 2.11MB
มาจาก Github

แอปที่เกี่ยวข้อง

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด