تنزيل VGLM - تنزيل رمز المصدر VGLM

VGLM

كود الذكاء الاصطناعي

1.0.0

تنزيل

نموذج لغة توليدي متعدد الاستخدامات

هذا هو تنفيذ الورقة:

استكشاف نموذج اللغة التنظيمية متعددة الاستخدامات عبر التعلم النقل الفعال للمعلمة . Zhaojiang Lin ، Andrea Madotto ، Pascale Fung نتائج EMNLP 2020 [PDF]

إذا كنت تستخدم أي رموز مصدر أو مجموعات بيانات مدرجة في مجموعة الأدوات هذه في عملك ، فيرجى الاستشهاد بالورقة التالية. bibtex مدرج أدناه:

 article {lin202020exploring ،
  العنوان = {استكشاف نموذج لغة توليدي متعددة الاستخدامات عبر التعلم الناقل الفعال للمعلمة} ،
  المؤلف = {Lin ، Zhaojiang و Madotto ، Andrea and Fung ، Pascale} ،
  Journal = {arxiv preprint arxiv: 2004.03829} ،
  السنة = {2020}
}

خلاصة

أظهرت نماذج اللغة التوليدية المسبقة التي تم تدريبها على مدار مهام توليد اللغة لأسفل نتائج واعدة. ومع ذلك ، فإنه يأتي مع تكلفة وجود نموذج واحد ، كبير ، لكل مهمة ، وهو ليس مثاليًا في سيناريوهات الذاكرة المنخفضة/الطاقة (على سبيل المثال ، الهاتف المحمول). في هذا العمل ، نقترح طريقة فعالة لضبط مهام التوليد المتعددة لأسفل في وقت واحد باستخدام نموذج واحد مدرب مسبقًا. تُظهر التجارب في خمس مهام توليد اللغة المتنوعة أنه من خلال استخدام معلمات إضافية من 2 إلى 3 ٪ لكل مهمة ، يمكن أن يحافظ نموذجنا أو حتى تحسين أداء صياغة النموذج بأكمله.

نموذج لغة توليدي متعدد الاستخدامات (VLM):

يتكون نموذج اللغة متعددة الاستخدامات (VLM) من ثلاثة مكونات: عظم خلفي لغوي مدرب مسبقًا (على سبيل المثال ، GPT-2) ، ونوعين من المعلمات المتخصصة لكل مهمة جيل مثل المحولات المتبقية منخفضة الرتبة وتضمينات المهمة.

التبعية

تحقق من الحزم المطلوبة أو قم بتشغيل الأمر ببساطة

 ❱❱❱ pip install -r requirements.txt

التجارب

مجموعة البيانات

قم بتنزيل مجموعات البيانات المعالجة مسبقًا

استنساخ

نحن نقدم نقطة تفتيش مدربة من VLM لدينا.

نموذج الاختبار: اختر مهمة واحدة من (MT ، تلخيص ، حوار ، QA ، NLG].

 ❱❱❱ python ./evaluate_vlm.py --task mt --no_sample --model_checkpoint $model_path

لحن GPT-2

الترجمة الآلية للقطار:

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json

اختبار الترجمة الآلية:

 ❱❱❱ python ./evaluate.py --task mt --no_sample --max_history=2 --model_checkpoint runs/$model_checkpoint

تحقق من Run.sh لتشغيل مهام أخرى

محولات قطار VLM وتضمينات المهام

تدريب الترجمة الآلية بدون تقطير المعرفة

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json --adapter_bottleneck 300 --lr 0.0005

تدريب الترجمة الآلية باستخدام تقطير المعرفة مستوى الجملة:

 ❱❱❱ python ./sentence_distiller.py --task mt --max_history=2 --model_checkpoint runs/$fully_finetuned_gpt2_checkpoint --no_sample

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json --adapter_bottleneck 300 --lr 0.0005 --distillation

اختبار الجهاز traslation:

 ❱❱❱ python ./evaluate.py --task mt --no_sample --adapter_bottleneck 300 --model_checkpoint runs/$model_checkpoint

تحقق من Run.sh لتشغيل مهام أخرى

الجمع بين جميع المحولات وتضمين المهام في نموذج واحد

السطر 68 من combine_all.py لتوفير قائمة نقطة التفتيش

 ❱❱❱ python combine_all.py

اختبار لمعرفة ما إذا كانت النتيجة هي نفسها

 ❱❱❱ python ./evaluate_vlm.py --task mt --no_sample --model_checkpoint $model_path

توضح البرامج النصية أعلاه كيفية تدريب VLM بشكل مستمر عندما تصل المهام بالتتابع.

التدريب متعدد المهام VLM

عندما تتوفر جميع المهام في نفس الوقت.

 ❱❱❱ python ./train_vlm.py --gradient_accumulation_steps=16 --train_batch_size=1 --valid_batch_size=1 --n_epochs 3

شكر وتقدير

يتم تنفيذ هذا المستودع قاعدة على luggingface

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-08
الحجم 425.49KB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل