تنزيل ContinualLM - تنزيل رمز المصدر ContinualLM

ContinualLM

كود الذكاء الاصطناعي

1.0.0

تنزيل

التواصل

تخيل LM التي لا تكتسب فقط معرفة جديدة ولكنها تحتفظ أيضًا بإتقان المهارات ، وكل ذلك أثناء نقل المعرفة بنجاح. هل هذا ممكن؟

أخبار

لقد أضفنا نقاط التفتيش في وجه المعانقة لسهولة التكاثر!
لقد أضفنا continual_pretrain.ipynb كمثال قائمة بذاتها لسيناريو تخزينها الناعم. إنه يعمل بشكل جيد بدون وحدات معالجة الرسومات!
يمكن أن يعمل كاسفة النعومة أيضًا في صقل دقيق مستمر تقليدي . تحقق من أحدث ورقة EMNLP23!
أتساءل عما إذا كان يمكنك تكييف LLM Box-Box دون القلق بشأن تحديث معلماتها؟ تحقق من آخر ورقة لدينا في جيل الاسترجاع المقيد (خرقة) هنا!

روابط سريعة

مقدمة
مثال بسيط
مجموعة البيانات
بنيان
تثبيت
المجال التكيف قبل التدريب
نهاية المهام النفي
نقاط التفتيش في Huggingface
مرجع
اتصال

مقدمة

في عام 2021 ، قدمنا Pycontinual ، وهو إطار مباشر ومرن للتعلم المستمر. استفاد بحثنا بشكل كبير من هذا الإطار. اليوم ، نحن متحمسون لمشاركة Continuallm ، وهو إطار تعليمي مستمر قابل للتمديد يركز على نماذج اللغة (LMS) ، المصمم للحفاظ على فوائد التعلم المستمر (CL) في هذا المجال.

التعلم المستمر لـ LMS يختلف عن CL التقليدية بسبب

تتم معاملة كل مهمة على أنها مجموعة خاصة بالمجال (في الوقت الحالي ، ينصب تركيزنا الأساسي على التدريب المسبق للتكيف مع المجال ، والذي يُعرف أيضًا باسم التمثيل المسبق أو بعد التدريب).
علاوة على ذلك ، تتضمن عملية التقييم صقل المهمة النهائية المقابلة.

يتضمن مستودعنا تنفيذ Pytorch لمجموعة من أساليب أحدث (SOTA) ، باستخدام نفس خط أنابيب التدريب والتقييم. يلتزم هذا المستودع بالتقدم في مجال التعلم المستمر لـ LMS. الأساليب المدرجة هي:

من مجموعتنا:
- DAS : التعلم المستمر لنماذج اللغة ، ICLR 2023
- CPT : التدريب المستمر لنماذج اللغة للتعلم قليلًا ، EMNLP 2022
- DGA : تكييف نموذج اللغة مع الحفاظ على معرفته العامة ، EMNLP 2022
- CTR : تحقيق النسيان الوقاية ونقل المعرفة في التعلم المستمر ، Neups 2021
- كلاسيكي : كلاسيكي: التعلم المستمر والتباين لمهام تصنيف المشاعر الجانبية ، EMNLP 2021
- B-Cl : تكييف BERT للتعلم المستمر لتسلسل مهام تصنيف المشاعر الجانبية ، NAACL 2021
من مجموعات أخرى (المزيد قادمة) :
- Demix : Demix Layers: Disentangling Domains لنمذجة اللغة المعيارية ؛ ، Gururangan et al. ، Naacl 2022)
- EWC : التغلب على النسيان الكارثي في الشبكات العصبية ، Kirkpatrick et al. ، PNAS 2017
- DER ++ : تجربة مظلمة للتعلم المستمر العام: خط أساس قوي وبسيط ، Buzzega et al. ، Neupips 2020
- HAT : التغلب على الكارثية النسيان مع الاهتمام الشاق بالمهمة ، Serrà et al. ، ICML 2018
خطوط الأساس العاملة على نطاق واسع للتعلم المستمر:
- NCL : التعلم المستمر الساذج: تدريب مستمر للتكيف مع سلسلة من المجالات ، دون أي اهتمام محدد توليه لقضايا نسيان أو نقل.
- الأول : إجراء تدريب مسبق للتكيف مع كل مجال بشكل فردي.
- محول واحد : يضيف محول إلى محول لكل مجال
- موجه واحد : يضيف موجه إلى المحول لكل مجال
- KD : تقطير المعرفة الساذج

مثال بسيط

لقد أضفنا continual_pretrain.ipynb كمثال قائمة بذاتها لسيناريو تخزينها الناعم. إنه يعمل بشكل جيد بدون وحدات معالجة الرسومات!

مجموعة البيانات

عندما يتعلق الأمر بالتعلم المستمر لنماذج اللغة (LMS) ، فإن العثور على مجموعات البيانات المناسبة أمر بالغ الأهمية. مجموعات البيانات التي نقدمها الالتزام بالمبادئ التالية:

المجال الخاص: يجب أن تكون مجموعة المجال محددة بما يكفي لتعزيز أداء المهام النهائية.
المهام النهائية المتاحة : نحن نفضل تقييم نماذج اللغة المدربة من خلال المهام النهائية بدلاً من الاعتماد على الحيرة ، لأن الأول يمثل نهج تقييم أكثر موثوقية.

نقوم بإصدار مجموعة البيانات الخاصة بنا التي تضم 6 مجالات مميزة ، كل منها مصحوب بمهمين نهائي المقابل. يمكن العثور على مجموعة البيانات هنا. فيما يلي بعض الإحصائيات لكل مجال:

كوربوس المجال	مقاس	نهاية المهمة	مهمة	#تمرين	#اختبار	#classes
مطعم Yelp	758 ميجابايت	مطعم	تصنيف مشاعر الجانب (ASC)	3452	1،120	3
هاتف أمازون	724 ميجابايت	هاتف	تصنيف مشاعر الجانب (ASC)	239	553	2
كاميرا الأمازون	319 ميجابايت	آلة تصوير	تصنيف مشاعر الجانب (ASC)	230	626	2
أوراق ACL	867 ميجابايت	ACL	تصنيف نية الاقتباس	1520	421	6
أوراق الذكاء الاصطناعي	507 ميجابايت	منظمة العفو الدولية	تصنيف العلاقة	2،260	2،388	7
أوراق PubMed	989MB	PubMed	التنبؤ بالتفاعل بين البروتين الكيميائي	2667	7،398	13

بنيان

بنية الاستمرارية تتبع إلى حد كبير هيكل pycontinual و CPT و DGA.

تثبيت

conda create --name continuallm --file requirements.txt

️ يعتمد نموذجنا على transformers==4.17.0 و adapter-transformers==3.0.1 . نوصي باستخدام هذه الإصدارات المحددة ، لأن استخدام الإصدارات الأخرى قد يؤدي إلى أخطاء غير متوقعة.

المجال التكيف قبل التدريب

هذا هو المكان الذي يحدث فيه التعلم المستمر. سوف نتعلم sequnce من المجالات.

max_samples=640000 
for idrandom in 0 
do    
 for pt_task in 0 1 2 3 4 5    
  do    
 python -m torch.distributed.launch --nproc_per_node 4 --use_env posttrain.py     
 --per_device_train_batch_size 62  
 --fp16     
 --max_seq_length 164  
 --max_samples ${max_samples}  
 --idrandom ${idrandom}  
 --ntasks 6  
 --pt_task ${pt_task}  
 --baseline ' das '
 done 
done

--idrandom : اختر تسلسل المهمة. انظر ./sequences لمزيد من التفاصيل.
--baseline : راجع مقدمة النماذج الأساسية المتاحة (انظر choices في config.py ).

نهاية المهام النفي

بعد التعلم المخروطي لـ LMS ، أصبحنا الآن قادرين على تقييم الأداء عن طريق تشغيل عملية ضبط المهام النهائية بشكل فردي .

max_samples=640000    
 seed=(2021 111 222 333 444 555 666 777 888 999)    
 for round in 0 ; do    
  for idrandom in 0 ;    
  do    
    for pt_task in 0 1 2 3 4 5   
    do    
      for ft_task in $( seq 0 ${pt_task} ) ;    
      do    
       python finetune.py     
       --max_seq_length 164  
       --pt_task ${pt_task}  
       --ft_task ${ft_task}  
       --idrandom ${idrandom}  
       --ntasks 6  
       --max_samples ${max_samples} 
       --seed ${seed[$round]}  
       --baseline ' das '    
       done    
    done   
  done  
done

نقاط التفتيش في Huggingface

بالنسبة لأولئك المهتمين فقط في النموذج الناتج أو يرغبون في متابعة كل تدريب النموذج مع بياناتهم الخاصة ، لدينا أخبار جيدة! نحن نقدم نقاط التفتيش من خلال معانقة الوجه.

يمكنك بسهولة استيراد نموذجنا المستمر بعد التدريب مع transformers Huggingface!

 import torch
from transformers import AutoTokenizer , AutoModelForSequenceClassification

# Import our model. The package will take care of downloading the models automatically
tokenizer = AutoTokenizer . from_pretrained ( "UIC-Liu-Lab/DAS-Rest2Cam" )
model = AutoModelForSequenceClassification . from_pretrained ( "UIC-Liu-Lab/DAS-Rest2Cam" , trust_remote_code = True )

# Tokenize input texts
texts = [
    "There's a kid on a skateboard." ,
    "A kid is skateboarding." ,
    "A kid is inside the house."
]
inputs = tokenizer ( texts , padding = True , truncation = True , return_tensors = "pt" )

# Get the model output!
res = model ( ** inputs )

إذا واجهت أي مشكلة عند تحميل النماذج مباشرة عن طريق واجهة برمجة تطبيقات HuggingFace ، فيمكنك أيضًا تنزيل النماذج يدويًا من repo واستخدام model = AutoModel.from_pretrained({PATH TO THE DOWNLOAD MODEL}) .

التسلسل المستمر قبل التدريب هو التسلسل الأول في ./sequences/posttrain (من مطعم إلى كاميرا ) ، يمكنك استخدام الأوزان التي تم تنزيلها لضبط المهام النهائية المقابلة.

إذا كنت مهتمًا بملفات الأهمية ، فيرجى الرجوع إلى before_distill0 و after_mlm{domain_id} . before أن يدل على الأهمية المحسوبة قبل التدريب المسبق ، والذي يتم مرة واحدة فقط قبل المجال الأول للمعرفة العامة التي تم تدريبها. after يشير إلى الأهمية المحسوبة بعد التدريب المسبق لـ Domain_id.

مرجع

نحن نقدر تقديرك بشدة في التحديق والإشارة إلى. انتباهك بالتفاصيل والاعتراف بتقدير كبير.

  
@inproceedings { ke2022dgs ,  
 title = { Continual Learning of Language Models } , author = { Ke, Zixuan and Shao, Yijia and Lin, Haowei and Konishi, Tatsuya and Kim, Gyuhak and Liu, Bing } , booktitle = { International Conference on Learning Representations (ICLR) } , year = { 2023 } }  
  
@inproceedings { ke2022dga ,  
 title = { Adapting a Language Model While Preserving its General Knowledge } , author = { Ke, Zixuan and Shao, Yijia and Lin, Haowei and Xu, Hu and Shu, Lei, and Liu, Bing } , booktitle = { Empirical Methods in Natural Language Processing (EMNLP) } , year = { 2022 } }  
  
@inproceedings { ke2022continual ,  
 title = { Continual Training of Language Models for Few-Shot Learning } , author = { Ke, Zixuan and Lin, Haowei and Shao, Yijia and Xu, Hu and Shu, Lei, and Liu, Bing } , booktitle = { Empirical Methods in Natural Language Processing (EMNLP) } , year = { 2022 } }

اتصال

إذا كان لديك أي أسئلة بخصوص الكود ، فلا تتردد في إرسال بريد إلكتروني إلى Zixuan Ke أو Yijia Shao أو Haowei Lin. بدلاً من ذلك ، يمكنك فتح مشكلة. نود أن نعرب عن امتناننا ل Bing Liu و Hu Xu و Lei Shu للحصول على تعليقاتهم وآرائهم القيمة

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-07
الحجم 673.21KB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل