ดาวน์โหลด VGLM - ดาวน์โหลดซอร์สโค้ด VGLM

VGLM

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

รูปแบบภาษาที่หลากหลาย

นี่คือการดำเนินการของกระดาษ:

การสำรวจแบบจำลองภาษากำเนิดที่หลากหลายผ่านการเรียนรู้การถ่ายโอนพารามิเตอร์ที่มีประสิทธิภาพ Zhaojiang Lin , Andrea Madotto , Pascale Fung ผลการวิจัยของ EMNLP 2020 [PDF]

หากคุณใช้ซอร์สโค้ดหรือชุดข้อมูลใด ๆ ที่รวมอยู่ในชุดเครื่องมือนี้ในงานของคุณโปรดอ้างอิงกระดาษต่อไปนี้ bibtex แสดงอยู่ด้านล่าง:

 @article {lin2020Exploring
  title = {การสำรวจแบบจำลองภาษาที่หลากหลายผ่านการเรียนรู้การถ่ายโอนพารามิเตอร์-ประสิทธิภาพ}
  ผู้แต่ง = {Lin, Zhaojiang และ Madotto, Andrea และ Fung, Pascale},
  journal = {arxiv preprint arxiv: 2004.03829},
  ปี = {2020}
-

เชิงนามธรรม

การปรับแต่งแบบจำลองภาษาที่ผ่านการฝึกอบรมล่วงหน้าไปยังงานการสร้างภาษาแบบดาวน์สตรีมได้แสดงผลลัพธ์ที่มีแนวโน้ม อย่างไรก็ตามมันมาพร้อมกับค่าใช้จ่ายในการมีแบบจำลองขนาดใหญ่ขนาดใหญ่สำหรับแต่ละงานซึ่งไม่เหมาะในสถานการณ์หน่วยความจำต่ำ/พลังงาน (เช่นมือถือ) ในงานนี้เราเสนอวิธีที่มีประสิทธิภาพสำหรับการปรับแต่งการสร้างงานหลายครั้งพร้อมกันโดยใช้แบบจำลองที่ผ่านการฝึกอบรมล่วงหน้าขนาดใหญ่ การทดลองในงานการสร้างภาษาที่หลากหลายห้างานแสดงให้เห็นว่าเพียงแค่ใช้พารามิเตอร์เพิ่มเติม 2-3% สำหรับแต่ละงานโมเดลของเราสามารถรักษาหรือปรับปรุงประสิทธิภาพของการปรับแต่งทั้งแบบจำลองทั้งหมด

โมเดลภาษากำเนิดที่หลากหลาย (VLM):

โมเดลภาษาอเนกประสงค์ (VLM) ประกอบด้วยสามองค์ประกอบ: รูปแบบภาษาที่ผ่านการฝึกอบรมมาก่อน (เช่น GPT-2) และพารามิเตอร์พิเศษสองชนิดสำหรับแต่ละรุ่นเช่นอะแดปเตอร์ที่เหลืออยู่ระดับต่ำ

การพึ่งพาอาศัยกัน

ตรวจสอบแพ็คเกจที่จำเป็นหรือเพียงเรียกใช้คำสั่ง

 ❱❱❱ pip install -r requirements.txt

การทดลอง

ชุดข้อมูล

ดาวน์โหลด ชุดข้อมูล ที่ประมวลผลล่วงหน้า

การทำซ้ำได้

เราให้ จุดตรวจ ที่ผ่านการฝึกอบรมของ VLM ของเรา

แบบจำลองการทดสอบ: เลือกหนึ่งงานจาก (MT, การสรุป, บทสนทนา, QA, NLG]

 ❱❱❱ python ./evaluate_vlm.py --task mt --no_sample --model_checkpoint $model_path

ปรับแต่ง GPT-2

การแปลเครื่องรถไฟ:

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json

การแปลเครื่องทดสอบ:

 ❱❱❱ python ./evaluate.py --task mt --no_sample --max_history=2 --model_checkpoint runs/$model_checkpoint

ตรวจสอบ run.sh เพื่อเรียกใช้งานอื่น ๆ

VLM รถไฟอะแดปเตอร์และการฝังงาน

การแปลเครื่องรถไฟโดยไม่มีการกลั่นความรู้

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json --adapter_bottleneck 300 --lr 0.0005

การแปลเครื่องรถไฟโดยใช้การกลั่นความรู้ระดับประโยค:

 ❱❱❱ python ./sentence_distiller.py --task mt --max_history=2 --model_checkpoint runs/$fully_finetuned_gpt2_checkpoint --no_sample

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json --adapter_bottleneck 300 --lr 0.0005 --distillation

เครื่องทดสอบ traslation:

 ❱❱❱ python ./evaluate.py --task mt --no_sample --adapter_bottleneck 300 --model_checkpoint runs/$model_checkpoint

ตรวจสอบ run.sh เพื่อเรียกใช้งานอื่น ๆ

รวมอะแดปเตอร์และงานที่ฝังอยู่ในรุ่นเดียวทั้งหมด

บรรทัดที่ 68 ของ combine_all.py เพื่อให้รายการจุดตรวจสอบ

 ❱❱❱ python combine_all.py

ทดสอบเพื่อดูว่าผลลัพธ์เหมือนกันหรือไม่

 ❱❱❱ python ./evaluate_vlm.py --task mt --no_sample --model_checkpoint $model_path

สคริปต์ข้างต้นแสดงวิธีการฝึกอบรม VLM อย่างต่อเนื่องเมื่องานมาถึงตามลำดับ

การฝึกอบรมมัลติทาสก์ VLM

เมื่องานทั้งหมดที่มีอยู่ในเวลาเดียวกัน

 ❱❱❱ python ./train_vlm.py --gradient_accumulation_steps=16 --train_batch_size=1 --valid_batch_size=1 --n_epochs 3

การรับทราบ

ที่เก็บนี้ถูกนำไปใช้กับฐานบน HuggingFace

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-08
ขนาด 425.49KB
มาจาก Github

แอปที่เกี่ยวข้อง

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด