OpenDelta Download - OpenDelta Source Code Download

إطار عمل مفتوح المصدر لضبط المعلمات (ضبط دلتا).

نظرة عامة • التثبيت • الاستخدام الأساسي • المستندات • الأداء •

ملخص

Opendelta هي مجموعة أدوات لطرق ضبط المعلمة الموفرة للمعلمة (نصفها كضبط دلتا ) ، والتي يمكن للمستخدمين من خلالها تعيين (أو إضافة) معلمات صغيرة للمبلغ للتحديث مع الحفاظ على معظم المعلمات المجمدة. باستخدام Opendelta ، يمكن للمستخدمين بسهولة تنفيذ صياغة البادئة أو المحولات أو Lora أو أي أنواع أخرى من ضبط دلتا مع PTMs المفضلة.

يتم اختبار أحدث إصدار من Opendelta على Python == 3.8.13 ، Pytorch == 1.12.1 ، Transformers == 4.22.2. من المحتمل أن يتم دعم الإصدارات الأخرى أيضًا. إذا واجهت الأخطاء عند استخدام إصدارات الحزمة الخاصة بك ، فيرجى إثارة مشكلة ، فسنبحث فيها في أقرب وقت ممكن.
عرض تجريبي لاستخدام Opendelta لتعديل PLM (على سبيل المثال ، BART).

أخبار

2022.10.25 الإصدار V0.3.2. دعم bmtrain! تحسين المستندات. أضف الفحص المرافق.
2022.10.14 الإصدار V0.3.0. نجعل استخدام التكوينات الافتراضية لكل طرق ضبط دلتا (أي الموضع المرفق) أكثر ودية! إذا كان لدى نموذج مخصص النماذج المدعومة لدينا كفيروسات فرعية في الداخل ، فإن التكوين الافتراضي متاح أيضًا. يمكن رؤية التغييرات الرئيسية الأخرى في سجل التحديث
2022.10.10 دمج فرع متطور V0.2.4 في الفرع الرئيسي. تحديثات المفاتيح هي (1) مثال على توحيد نموذج ضبط الدلتا ونموذج التثبيت المذهل ؛ (2) ودعم مركز دلتا ، الذي لا تزال صفحة الويب قيد الإنشاء. يمكن رؤية التفاصيل في سجل التحديث
2022.03.24 نلاحظ العديد من الأخطاء في ضبط المطالبة الناعمة وضبط البادئة ، ويرجع ذلك أساسا إلى حاجتهم إلى تخصيص معرفات الانتباه ، token_type_ids ، نحن نصلحها! حاليا ، يرجى استخدام الأساليب الأخرى لأنها stabler وأفضل في الأداء.
2022.03.20 إضافة مثال كولاب لتوضيح التدريب الفعال وتوفير المهام المتعددة الموفر للمساحة.
2022.03.20 إصدار PIP جديد تم إصداره.
2022.02.16 دعم التعبير العادي في العنوان القائم على اسم.

تثبيت

إنشاء VirtualEnv (اختياري)

conda create -n opendelta_env python=3.8
conda activate opendelta_env

تثبيت أحدث إصدار

pip install git+https://github.com/thunlp/OpenDelta.git

أو تثبيت أحدث إصدار PIP (أكثر استقرارًا)

pip install opendelta

أو بناء من المصدر

git clone [email protected]:thunlp/OpenDelta.git
cd OpenDelta
python setup.py install
# python setup.py develop # if you want to do some modifications on the code for your research:

يجب أن تحاول

الرموز والتعليقات التالية تسير لك من خلال الوظيفة الرئيسية لـ Opendelta. إنه أيضًا في must_try.py و must_try.ipynb في كولاب.

 # use transformers as usual.
from transformers import AutoModelForSeq2SeqLM , AutoTokenizer
t5 = AutoModelForSeq2SeqLM . from_pretrained ( "t5-large" )
t5_tokenizer = AutoTokenizer . from_pretrained ( "t5-large" )
# A running example
inputs_ids = t5_tokenizer . encode ( "Is Harry Potter written by J.K. Rowling" , return_tensors = "pt" )
t5_tokenizer . decode ( t5 . generate ( inputs_ids )[ 0 ]) 
# >>> '<pad><extra_id_0>? Is it Harry Potter?</s>'


# use existing delta models
from opendelta import AutoDeltaModel , AutoDeltaConfig
# use existing delta models from DeltaCenter
delta = AutoDeltaModel . from_finetuned ( "thunlp/Spelling_Correction_T5_LRAdapter_demo" , backbone_model = t5 )
# freeze the whole backbone model except the delta models.
delta . freeze_module ()
# visualize the change
delta . log ()


t5_tokenizer . decode ( t5 . generate ( inputs_ids )[ 0 ]) 
# >>> <pad> Is Harry Potter written by J.K. Rowling?</s>


# Now save merely the delta models, not the whole backbone model, to tmp/
delta . save_finetuned ( ".tmp" )
import os ; os . listdir ( ".tmp" )
# >>>  The state dict size is 1.443 MB
# >>>  We encourage users to push their final and public models to delta center to share them with the community!


# reload the model from local url and add it to pre-trained T5.
t5 = AutoModelForSeq2SeqLM . from_pretrained ( "t5-large" )
delta1 = AutoDeltaModel . from_finetuned ( ".tmp" , backbone_model = t5 )
import shutil ; shutil . rmtree ( ".tmp" ) # don't forget to remove the tmp files. 
t5_tokenizer . decode ( t5 . generate ( inputs_ids )[ 0 ]) 
# >>> <pad> Is Harry Potter written by J.K. Rowling?</s>

# detach the delta models, the model returns to the unmodified status.
delta1 . detach ()
t5_tokenizer . decode ( t5 . generate ( inputs_ids )[ 0 ])  
# >>> '<pad><extra_id_0>? Is it Harry Potter?</s>'

# use default configuration for customized wrapped models which have PLMs inside. This is a common need for users. 
import torch . nn as nn
class WrappedModel ( nn . Module ):
  def __init__ ( self , inner_model ):
    super (). __init__ ()
    self . inner = inner_model
  def forward ( self , * args , ** kwargs ):
    return self . inner ( * args , ** kwargs )

wrapped_model = WrappedModel ( WrappedModel ( t5 ))

# say we use LoRA
delta_config = AutoDeltaConfig . from_dict ({ "delta_type" : "lora" })
delta2 = AutoDeltaModel . from_config ( delta_config , backbone_model = wrapped_model )
delta2 . log ()
# >>> root
#       -- inner
#          -- inner
#             ...
#             ... lora_A:[8,1024], lora_B:[1024,8]
delta2 . detach ()

# use a not default configuration
# say we add lora to the last four layer of the decoder of t5, with lora rank=5
delta_config3 = AutoDeltaConfig . from_dict ({ "delta_type" : "lora" , "modified_modules" :[ "[r]decoder.*((20)|(21)|(22)|(23)).*DenseReluDense.wi" ], "lora_r" : 5 })
delta3 = AutoDeltaModel . from_config ( delta_config3 , backbone_model = wrapped_model )
delta3 . log ()

تم التحقق من التكوينات الافتراضية

يمكنك محاولة استخدام Opendelta على أي نماذج من العمود الفقري بناءً على Pytorch.
ومع ذلك ، مع فرص صغيرة لا يتم دعم واجهة العداوة الفرعية لنموذج العمود الفقري. لذلك تحققنا من بعض النماذج الشائعة الاستخدام التي من المؤكد أن Opendelta تدعمها.
سنستمر في اختبار المزيد والمزيد من النماذج الناشئة.
يتم الترحيب بطلبات السحب عند تطبيق OpendaLa على طراز العمود الفقري بنجاح على طراز العمود الفقري الخاص بك.

اقتباس

 @article { hu2023opendelta ,
  title = { OpenDelta: A Plug-and-play Library for Parameter-efficient Adaptation of Pre-trained Models } ,
  author = { Hu, Shengding and Ding, Ning and Zhao, Weilin and Lv, Xingtai and Zhang, Zhen and Liu, Zhiyuan and Sun, Maosong } ,
  journal = { arXiv preprint arXiv:2307.03084 } ,
  year = { 2023 }
}

 @article { ding2022delta ,
  title = { Delta tuning: A comprehensive study of parameter efficient methods for pre-trained language models } ,
  author = { Ding, Ning and Qin, Yujia and Yang, Guang and Wei, Fuchao and Yang, Zonghan and Su, Yusheng and Hu, Shengding and Chen, Yulin and Chan, Chi-Min and Chen, Weize and others } ,
  journal = { arXiv preprint arXiv:2203.06904 } ,
  year = { 2022 }
}