Скачать flan alpaca lora - flan alpaca lora Source Code Скачать

flan alpaca lora

AI Исходный код

1.0.0

Скачать

?

Этот репо обучает Google/Flan-T5 в наборе данных Alpaca с методом обучения с низкой оценкой. Это уменьшает необходимую память графического процессора и ускоряет тренировку.

17 июня 2023 года: добавьте ноутбук. Вы можете попробовать Flan-Alpaca-Lora сейчас.

3 мая 2023 года: Train Flan-T5-XL с использованием набора данных Alpaca-GPT4.

13 апреля 2023 года: Train Flan-T5-xl с использованием набора данных Gpteacher (инструктирование и ролевая игра), который, кажется, работает хорошо.

5 апреля 2023 года: поезда Flan-T5-XXL с использованием 8-битного квантования. Модель может быть включена в один 3090 графический процессор. Все модели можно найти в Huggingface.

модель	adapter_params	данные	Графический процессор	время
Флан-альпака-лора-баз	0,9м	Альпака очищена	3090	20 минут
Флан-Альпака-Лор-Ларж	2,4 м	Альпака очищена	3090	50 минут
Flan-Alpaca-Lora-xl	4,7 м	Альпака очищена	3090	2,5 часа
Flan-Alpaca-Lora-xxl	9,4 м	Альпака очищена	3090	10 часов
Flan-Gpteacher-Lora-xl	4,7 м	Gpteacher	3090	80 минут
FLAN-ALPACA-GPT4-LORA-XL	4,7 м	альпака-GPT4	3090	3,25 часа

Зависимости

 torch == 1.13.1
transformers == 4.29.1
peft == 0.3.0
bitsandbytes==0.38.1
accelerate==0.19.0

Новейшая версия этих пакетов должна работать нормально.

Обучение

Следующая команда Finetune Flan-T5-база с 20 минут на одном 3090-графическом процессоре

python train.py 
    --model_name_or_path google/flan-t5-base 
    --data_path ./alpaca_data_cleaned.json 
    --bf16 True 
    --output_dir ./ckpts/ 
    --num_train_epochs 3 
    --per_device_train_batch_size 8 
    --gradient_accumulation_steps 8 
    --evaluation_strategy " no " 
    --save_strategy " no " 
    --learning_rate 5e-4 
    --weight_decay 0. 
    --warmup_ratio 0.03 
    --lr_scheduler_type " cosine " 
    --logging_steps 50 
    --tf32 True

Пример использования:

 import transformers
from peft import PeftModel

# Where peft_model_id should be the saving directory or huggingface model id
model_name = "google/flan-t5-large" ; peft_model_id = "reasonwang/flan-alpaca-lora-large"
tokenizer = transformers . AutoTokenizer . from_pretrained ( model_name )
base_model = transformers . AutoModelForSeq2SeqLM . from_pretrained ( model_name )
peft_model = PeftModel . from_pretrained ( base_model , peft_model_id )

# Input an instruction or any other questions.
inputs = tokenizer ( "List a few tips to get good scores in math." , return_tensors = "pt" )
outputs = peft_model . generate ( ** inputs , max_length = 128 , do_sample = True )
print ( tokenizer . batch_decode ( outputs , skip_special_tokens = True ))