flan alpaca lora Download - flan alpaca lora Download do código fonte

flan alpaca lora

Código-Fonte de IA

1.0.0

Baixar

??? Flan-Alpaca-Lora: Ajuste de instrução de humanos e máquinas com adaptação de baixo rank

Este repo treina o Google/flan-t5 no conjunto de dados da ALPACA com método de treinamento de adaptação de baixo rank. Reduz a memória da GPU necessária e acelera o treinamento.

17 de junho de 2023: adicione um caderno. Você pode experimentar o Flan-Alpaca-Lora com agora.

3 de maio de 2023: treinar flan-t5-xl usando o conjunto de dados ALPACA-GPT4.

13 de abril de 2023: treinar flan-t5-xl usando o conjunto de dados Gpteacher (Instruct and RolePlay), que parece ter um bom desempenho.

5 de abril de 2023: trem Flan-T5-XXL usando quantização de 8 bits. O modelo pode ser instalado em uma única GPU 3090. Todos os modelos podem ser encontrados no Huggingface.

modelo	adaptador_params	dados	GPU	tempo
FLAN-ALPACA-LORA-BASE	0,9m	Alpaca limpa	3090	20mins
Flan-Alpaca-Lora-Large	2.4m	Alpaca limpa	3090	50mins
flan-alpaca-lora-xl	4,7m	Alpaca limpa	3090	2,5 horas
flan-alpaca-lora-xxl	9,4m	Alpaca limpa	3090	10 horas
Flan-Gpteacher-Lora-Xl	4,7m	Gptoacher	3090	80mins
flan-alpaca-gpt4-lora-xl	4,7m	ALPACA-GPT4	3090	3,25 horas

Dependências

 torch == 1.13.1
transformers == 4.29.1
peft == 0.3.0
bitsandbytes==0.38.1
accelerate==0.19.0

A versão mais recente desses pacotes deve funcionar bem.

Treinamento

O seguinte comando FineTune Flan-T5-BASE com apenas 20 minutos em uma única GPU 3090

python train.py 
    --model_name_or_path google/flan-t5-base 
    --data_path ./alpaca_data_cleaned.json 
    --bf16 True 
    --output_dir ./ckpts/ 
    --num_train_epochs 3 
    --per_device_train_batch_size 8 
    --gradient_accumulation_steps 8 
    --evaluation_strategy " no " 
    --save_strategy " no " 
    --learning_rate 5e-4 
    --weight_decay 0. 
    --warmup_ratio 0.03 
    --lr_scheduler_type " cosine " 
    --logging_steps 50 
    --tf32 True

Exemplo de uso:

 import transformers
from peft import PeftModel

# Where peft_model_id should be the saving directory or huggingface model id
model_name = "google/flan-t5-large" ; peft_model_id = "reasonwang/flan-alpaca-lora-large"
tokenizer = transformers . AutoTokenizer . from_pretrained ( model_name )
base_model = transformers . AutoModelForSeq2SeqLM . from_pretrained ( model_name )
peft_model = PeftModel . from_pretrained ( base_model , peft_model_id )

# Input an instruction or any other questions.
inputs = tokenizer ( "List a few tips to get good scores in math." , return_tensors = "pt" )
outputs = peft_model . generate ( ** inputs , max_length = 128 , do_sample = True )
print ( tokenizer . batch_decode ( outputs , skip_special_tokens = True ))

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-03
tamanho 13.55MB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Bola Alpaca: Allstars

2022-08-08

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos