Este repo treina o Google/flan-t5 no conjunto de dados da ALPACA com método de treinamento de adaptação de baixo rank. Reduz a memória da GPU necessária e acelera o treinamento.
17 de junho de 2023: adicione um caderno. Você pode experimentar o Flan-Alpaca-Lora com agora.
3 de maio de 2023: treinar flan-t5-xl usando o conjunto de dados ALPACA-GPT4.
13 de abril de 2023: treinar flan-t5-xl usando o conjunto de dados Gpteacher (Instruct and RolePlay), que parece ter um bom desempenho.
5 de abril de 2023: trem Flan-T5-XXL usando quantização de 8 bits. O modelo pode ser instalado em uma única GPU 3090. Todos os modelos podem ser encontrados no Huggingface.
| modelo | adaptador_params | dados | GPU | tempo |
|---|---|---|---|---|
| FLAN-ALPACA-LORA-BASE | 0,9m | Alpaca limpa | 3090 | 20mins |
| Flan-Alpaca-Lora-Large | 2.4m | Alpaca limpa | 3090 | 50mins |
| flan-alpaca-lora-xl | 4,7m | Alpaca limpa | 3090 | 2,5 horas |
| flan-alpaca-lora-xxl | 9,4m | Alpaca limpa | 3090 | 10 horas |
| Flan-Gpteacher-Lora-Xl | 4,7m | Gptoacher | 3090 | 80mins |
| flan-alpaca-gpt4-lora-xl | 4,7m | ALPACA-GPT4 | 3090 | 3,25 horas |
torch == 1.13.1
transformers == 4.29.1
peft == 0.3.0
bitsandbytes==0.38.1
accelerate==0.19.0
A versão mais recente desses pacotes deve funcionar bem.
O seguinte comando FineTune Flan-T5-BASE com apenas 20 minutos em uma única GPU 3090
python train.py
--model_name_or_path google/flan-t5-base
--data_path ./alpaca_data_cleaned.json
--bf16 True
--output_dir ./ckpts/
--num_train_epochs 3
--per_device_train_batch_size 8
--gradient_accumulation_steps 8
--evaluation_strategy " no "
--save_strategy " no "
--learning_rate 5e-4
--weight_decay 0.
--warmup_ratio 0.03
--lr_scheduler_type " cosine "
--logging_steps 50
--tf32 TrueExemplo de uso:
import transformers
from peft import PeftModel
# Where peft_model_id should be the saving directory or huggingface model id
model_name = "google/flan-t5-large" ; peft_model_id = "reasonwang/flan-alpaca-lora-large"
tokenizer = transformers . AutoTokenizer . from_pretrained ( model_name )
base_model = transformers . AutoModelForSeq2SeqLM . from_pretrained ( model_name )
peft_model = PeftModel . from_pretrained ( base_model , peft_model_id )
# Input an instruction or any other questions.
inputs = tokenizer ( "List a few tips to get good scores in math." , return_tensors = "pt" )
outputs = peft_model . generate ( ** inputs , max_length = 128 , do_sample = True )
print ( tokenizer . batch_decode ( outputs , skip_special_tokens = True ))