Téléchargement OpenDelta - Téléchargement du code source OpenDelta

Un cadre open source pour un réglage économe en paramètres (réglage delta).

Présentation • Installation • Utilisation de base • Docs • Performances •

Aperçu

OpenlElta est une boîte à outils pour les méthodes de réglage économe en paramètres (nous le supprimons comme un réglage delta ), par lequel les utilisateurs pourraient attribuer (ou ajouter) une petite quantité de paramètres à mettre à jour tout en gardant le plus de paramètres figés. En utilisant Opendelta, les utilisateurs pourraient facilement implémenter le préfixe, les adaptateurs, la LORA ou tout autre type de réglage delta avec des PTM préférés.

La dernière version d'Opendelta est testée sur Python == 3.8.13, pytorch == 1.12.1, transformateurs == 4.22.2. D'autres versions sont également susceptibles d'être prises en charge. Si vous rencontrez des bogues lorsque vous utilisez vos propres versions de package, veuillez soulever un problème, nous y examinerons dès que possible.
Une démonstration d'utilisation d'Opendelta pour modifier le PLM (par exemple, BART).

Nouvelles

2022.10.25 Release V0.3.2. Soutenez BMTRAIN! Améliorer les documents. Ajoutez des utilitaires Inspecter.
2022.10.14 Release V0.3.0. Nous effectuons l'utilisation de configurations par défaut de chaque méthode de réglage delta (c'est-à-dire la position qu'elles sont attachées) plus amicale! Si un modèle personnalisé dispose de nos modèles pris en charge sous forme de sous-modules à l'intérieur, la configuration par défaut est également disponible. D'autres modifications clés peuvent être vues dans le journal de mise à jour
2022.10.10 Fusionner une branche à long terme V0.2.4 dans la branche maître. Les mises à jour clés sont (1) l'exemple unificateur du paradigme de réglage delta et du paradigme d'invite; (2) et support pour Delta Center, dont la page Web est toujours en construction. Les détails peuvent être vus dans le journal de mise à jour
2022.03.24 Nous remarquons plusieurs bugs dans le réglage invite et le réglage du préfixe, principalement en raison de leur besoin de personnaliser les identifiants d'attention, token_type_ids, nous le réparons! Actuellement, veuillez utiliser les autres méthodes car elles sont stabler et meilleures en performances.
2022.03.20 Ajoutez un exemple de colab pour illustrer une formation efficace et un service multitâche à économie d'espace.
2022.03.20 Une nouvelle version PIP publiée.
2022.02.16 Soutenez l'expression régulière dans l'adressage basé sur le nom.

Installation

Créer un virtualenv (facultatif)

conda create -n opendelta_env python=3.8
conda activate opendelta_env

Installez la dernière version

pip install git+https://github.com/thunlp/OpenDelta.git

ou installer la dernière version PIP (plus stable)

pip install opendelta

ou construire à partir de la source

git clone [email protected]:thunlp/OpenDelta.git
cd OpenDelta
python setup.py install
# python setup.py develop # if you want to do some modifications on the code for your research:

Doit essayer

Les codes et commentaires suivants vous guident à travers la fonctionnalité clé d'Opendelta. Il est également dans must_try.py et must_try.ipynb dans Colab.

 # use transformers as usual.
from transformers import AutoModelForSeq2SeqLM , AutoTokenizer
t5 = AutoModelForSeq2SeqLM . from_pretrained ( "t5-large" )
t5_tokenizer = AutoTokenizer . from_pretrained ( "t5-large" )
# A running example
inputs_ids = t5_tokenizer . encode ( "Is Harry Potter written by J.K. Rowling" , return_tensors = "pt" )
t5_tokenizer . decode ( t5 . generate ( inputs_ids )[ 0 ]) 
# >>> '<pad><extra_id_0>? Is it Harry Potter?</s>'


# use existing delta models
from opendelta import AutoDeltaModel , AutoDeltaConfig
# use existing delta models from DeltaCenter
delta = AutoDeltaModel . from_finetuned ( "thunlp/Spelling_Correction_T5_LRAdapter_demo" , backbone_model = t5 )
# freeze the whole backbone model except the delta models.
delta . freeze_module ()
# visualize the change
delta . log ()


t5_tokenizer . decode ( t5 . generate ( inputs_ids )[ 0 ]) 
# >>> <pad> Is Harry Potter written by J.K. Rowling?</s>


# Now save merely the delta models, not the whole backbone model, to tmp/
delta . save_finetuned ( ".tmp" )
import os ; os . listdir ( ".tmp" )
# >>>  The state dict size is 1.443 MB
# >>>  We encourage users to push their final and public models to delta center to share them with the community!


# reload the model from local url and add it to pre-trained T5.
t5 = AutoModelForSeq2SeqLM . from_pretrained ( "t5-large" )
delta1 = AutoDeltaModel . from_finetuned ( ".tmp" , backbone_model = t5 )
import shutil ; shutil . rmtree ( ".tmp" ) # don't forget to remove the tmp files. 
t5_tokenizer . decode ( t5 . generate ( inputs_ids )[ 0 ]) 
# >>> <pad> Is Harry Potter written by J.K. Rowling?</s>

# detach the delta models, the model returns to the unmodified status.
delta1 . detach ()
t5_tokenizer . decode ( t5 . generate ( inputs_ids )[ 0 ])  
# >>> '<pad><extra_id_0>? Is it Harry Potter?</s>'

# use default configuration for customized wrapped models which have PLMs inside. This is a common need for users. 
import torch . nn as nn
class WrappedModel ( nn . Module ):
  def __init__ ( self , inner_model ):
    super (). __init__ ()
    self . inner = inner_model
  def forward ( self , * args , ** kwargs ):
    return self . inner ( * args , ** kwargs )

wrapped_model = WrappedModel ( WrappedModel ( t5 ))

# say we use LoRA
delta_config = AutoDeltaConfig . from_dict ({ "delta_type" : "lora" })
delta2 = AutoDeltaModel . from_config ( delta_config , backbone_model = wrapped_model )
delta2 . log ()
# >>> root
#       -- inner
#          -- inner
#             ...
#             ... lora_A:[8,1024], lora_B:[1024,8]
delta2 . detach ()

# use a not default configuration
# say we add lora to the last four layer of the decoder of t5, with lora rank=5
delta_config3 = AutoDeltaConfig . from_dict ({ "delta_type" : "lora" , "modified_modules" :[ "[r]decoder.*((20)|(21)|(22)|(23)).*DenseReluDense.wi" ], "lora_r" : 5 })
delta3 = AutoDeltaModel . from_config ( delta_config3 , backbone_model = wrapped_model )
delta3 . log ()

Configurations par défaut vérifiées

Vous pouvez essayer d'utiliser Opendelta sur tous les modèles d'épine dorsale basés sur Pytorch.
Cependant, avec de petites chances que l'interface des sous-modules du modèle de squelette ne soit pas prise en charge. Par conséquent, nous avons vérifié certains modèles couramment utilisés qu'Opendelta prendra sûrement.
Nous continuerons de tester de plus en plus de modèles émergents.
Les demandes de traction sont les bienvenues lorsque vous appliquez Opendelta avec succès sur votre propre modèle de squelette.

Citation

 @article { hu2023opendelta ,
  title = { OpenDelta: A Plug-and-play Library for Parameter-efficient Adaptation of Pre-trained Models } ,
  author = { Hu, Shengding and Ding, Ning and Zhao, Weilin and Lv, Xingtai and Zhang, Zhen and Liu, Zhiyuan and Sun, Maosong } ,
  journal = { arXiv preprint arXiv:2307.03084 } ,
  year = { 2023 }
}

 @article { ding2022delta ,
  title = { Delta tuning: A comprehensive study of parameter efficient methods for pre-trained language models } ,
  author = { Ding, Ning and Qin, Yujia and Yang, Guang and Wei, Fuchao and Yang, Zonghan and Su, Yusheng and Hu, Shengding and Chen, Yulin and Chan, Chi-Min and Chen, Weize and others } ,
  journal = { arXiv preprint arXiv:2203.06904 } ,
  year = { 2022 }
}