OpenDelta Download - OpenDelta Código Fonte Download

Uma estrutura de código aberto para ajuste com eficiência de parâmetro (ajuste delta).

Visão geral • Instalação • Uso básico • Documentos • Desempenho •

Visão geral

OpenDelta é um kit de ferramentas para métodos de ajuste com eficiência de parâmetros (nós o dublamos como ajuste da Delta ), pelo qual os usuários poderiam atribuir de maneira flexível (ou adicionar) um pequeno número de parâmetros de quantidade para atualizar, mantendo o maior número de parâmetros congelados. Ao usar o OpendElta, os usuários podem facilmente implementar ajustes de prefixos, adaptadores, Lora ou qualquer outro tipo de ajuste da Delta com PTMS preferido.

A versão mais recente do Opendelta é testada no Python == 3.8.13, pytorch == 1.12.1, Transformers == 4.22.2. Outras versões provavelmente também serão suportadas. Se você encontrar bugs ao usar as versões do seu próprio pacote, levante um problema, investigaremos o mais rápido possível.
Uma demonstração de usar opendelta para modificar o PLM (por exemplo, Bart).

Notícias

2022.10.25 Release v0.3.2. Apoie o BMTrain! Melhorar os documentos. Adicione utilitários de inspeção.
2022.10.14 Release v0.3.0. Fazemos o uso de configurações padrão de cada métodos de ajuste da Delta (ou seja, a posição em que estão anexados) mais amigáveis! Se um modelo personalizado tiver nossos modelos suportados como submódulos internos, a configuração padrão também estará disponível. Outras alterações importantes podem ser vistas no log de atualização
2022.10.10 Mesclar uma filial de longa data v0.2.4 no ramo mestre. As principais atualizações são (1) o exemplo unificando o paradigma de ajuste delta e o paradigma de ajuste rápido; (2) e suporte ao Delta Center, cuja página da web ainda está em construção. Detalhes podem ser vistos no log de atualização
2022.03.24 Notamos vários bugs em ajuste rápido e ajuste prefixo, principalmente devido à sua necessidade de personalizar IDs de atenção, token_type_ids, estamos consertando! Atualmente, use os outros métodos, pois eles são mais estáveis e melhores no desempenho.
2022.03.20 Adicione um exemplo de colab para ilustrar treinamento eficiente e que economize espaço para economizar espaço.
2022.03.20 Uma nova versão PIP foi lançada.
2022.02.16 Apoie a expressão regular em endereçamento baseado em nome.

Instalação

Crie um VirtualEnv (opcional)

conda create -n opendelta_env python=3.8
conda activate opendelta_env

Instale a versão mais recente

pip install git+https://github.com/thunlp/OpenDelta.git

ou instale a versão mais recente (mais estável)

pip install opendelta

ou construir a partir da fonte

git clone [email protected]:thunlp/OpenDelta.git
cd OpenDelta
python setup.py install
# python setup.py develop # if you want to do some modifications on the code for your research:

Deve tentar

Os seguintes códigos e comentários o orientam na funcionalidade principal do OpenDelta. Também está em must_try.py e must_try.ipynb em colab.

 # use transformers as usual.
from transformers import AutoModelForSeq2SeqLM , AutoTokenizer
t5 = AutoModelForSeq2SeqLM . from_pretrained ( "t5-large" )
t5_tokenizer = AutoTokenizer . from_pretrained ( "t5-large" )
# A running example
inputs_ids = t5_tokenizer . encode ( "Is Harry Potter written by J.K. Rowling" , return_tensors = "pt" )
t5_tokenizer . decode ( t5 . generate ( inputs_ids )[ 0 ]) 
# >>> '<pad><extra_id_0>? Is it Harry Potter?</s>'


# use existing delta models
from opendelta import AutoDeltaModel , AutoDeltaConfig
# use existing delta models from DeltaCenter
delta = AutoDeltaModel . from_finetuned ( "thunlp/Spelling_Correction_T5_LRAdapter_demo" , backbone_model = t5 )
# freeze the whole backbone model except the delta models.
delta . freeze_module ()
# visualize the change
delta . log ()


t5_tokenizer . decode ( t5 . generate ( inputs_ids )[ 0 ]) 
# >>> <pad> Is Harry Potter written by J.K. Rowling?</s>


# Now save merely the delta models, not the whole backbone model, to tmp/
delta . save_finetuned ( ".tmp" )
import os ; os . listdir ( ".tmp" )
# >>>  The state dict size is 1.443 MB
# >>>  We encourage users to push their final and public models to delta center to share them with the community!


# reload the model from local url and add it to pre-trained T5.
t5 = AutoModelForSeq2SeqLM . from_pretrained ( "t5-large" )
delta1 = AutoDeltaModel . from_finetuned ( ".tmp" , backbone_model = t5 )
import shutil ; shutil . rmtree ( ".tmp" ) # don't forget to remove the tmp files. 
t5_tokenizer . decode ( t5 . generate ( inputs_ids )[ 0 ]) 
# >>> <pad> Is Harry Potter written by J.K. Rowling?</s>

# detach the delta models, the model returns to the unmodified status.
delta1 . detach ()
t5_tokenizer . decode ( t5 . generate ( inputs_ids )[ 0 ])  
# >>> '<pad><extra_id_0>? Is it Harry Potter?</s>'

# use default configuration for customized wrapped models which have PLMs inside. This is a common need for users. 
import torch . nn as nn
class WrappedModel ( nn . Module ):
  def __init__ ( self , inner_model ):
    super (). __init__ ()
    self . inner = inner_model
  def forward ( self , * args , ** kwargs ):
    return self . inner ( * args , ** kwargs )

wrapped_model = WrappedModel ( WrappedModel ( t5 ))

# say we use LoRA
delta_config = AutoDeltaConfig . from_dict ({ "delta_type" : "lora" })
delta2 = AutoDeltaModel . from_config ( delta_config , backbone_model = wrapped_model )
delta2 . log ()
# >>> root
#       -- inner
#          -- inner
#             ...
#             ... lora_A:[8,1024], lora_B:[1024,8]
delta2 . detach ()

# use a not default configuration
# say we add lora to the last four layer of the decoder of t5, with lora rank=5
delta_config3 = AutoDeltaConfig . from_dict ({ "delta_type" : "lora" , "modified_modules" :[ "[r]decoder.*((20)|(21)|(22)|(23)).*DenseReluDense.wi" ], "lora_r" : 5 })
delta3 = AutoDeltaModel . from_config ( delta_config3 , backbone_model = wrapped_model )
delta3 . log ()

Configurações padrão verificadas

Você pode tentar usar o OpendElta em qualquer modelo de backbone baseado em Pytorch.
No entanto, com pequenas chances de que a interface dos submódulos do modelo de backbone não seja suportada. Portanto, verificamos alguns modelos comumente usados que o Opendelta certamente apoiarão.
Continuaremos testando cada vez mais modelos emergentes.
As solicitações de tração são bem -vindas quando você aplicar com sucesso o OpendElta em seu próprio modelo de espinha dorsal.

Citação

 @article { hu2023opendelta ,
  title = { OpenDelta: A Plug-and-play Library for Parameter-efficient Adaptation of Pre-trained Models } ,
  author = { Hu, Shengding and Ding, Ning and Zhao, Weilin and Lv, Xingtai and Zhang, Zhen and Liu, Zhiyuan and Sun, Maosong } ,
  journal = { arXiv preprint arXiv:2307.03084 } ,
  year = { 2023 }
}

 @article { ding2022delta ,
  title = { Delta tuning: A comprehensive study of parameter efficient methods for pre-trained language models } ,
  author = { Ding, Ning and Qin, Yujia and Yang, Guang and Wei, Fuchao and Yang, Zonghan and Su, Yusheng and Hu, Shengding and Chen, Yulin and Chan, Chi-Min and Chen, Weize and others } ,
  journal = { arXiv preprint arXiv:2203.06904 } ,
  year = { 2022 }
}