flan alpaca loraダウンロード-Flan flan alpaca loraソースコードダウンロード

flan alpaca lora

AI ソースコード

1.0.0

ダウンロード

？

このレポは、低ランク適応トレーニング方法を備えたAlpacaデータセットでGoogle/Flan-T5を訓練します。必要なGPUメモリを削減し、トレーニングを高速化します。

2023年6月17日：ノートを追加します。 Flan-Alpaca-Loraを今試すことができます。

2023年5月3日：ALPACA-GPT4データセットを使用してFlan-T5-XLを訓練します。

2023年4月13日：Gpteacherデータセット（instruct and Roleplay）を使用してFlan-T5-XLを訓練します。

2023年4月5日：8ビット量子化を使用してFlan-T5-XXLを訓練します。モデルは、単一の3090 GPUに取り付けることができます。すべてのモデルは、Huggingfaceにあります。

モデル	adapter_params	データ	GPU	時間
flan-alpaca-lora-base	0.9m	アルパカは掃除しました	3090	20分
flan-alpaca-lora-rarge	2.4m	アルパカは掃除しました	3090	50分
flan-alpaca-lora-xl	4.7m	アルパカは掃除しました	3090	2.5時間
flan-alpaca-lora-xxl	9.4m	アルパカは掃除しました	3090	10時間
flan-gpteacher-lora-xl	4.7m	gpteacher	3090	80分
flan-alpaca-gpt4-lora-xl	4.7m	alpaca-gpt4	3090	3.25時間

依存関係

 torch == 1.13.1
transformers == 4.29.1
peft == 0.3.0
bitsandbytes==0.38.1
accelerate==0.19.0

これらのパッケージの最新バージョンは正常に動作するはずです。

トレーニング

次のコマンドFinetune Flan-T5-Baseは、単一の3090 GPUでわずか20分で

python train.py 
    --model_name_or_path google/flan-t5-base 
    --data_path ./alpaca_data_cleaned.json 
    --bf16 True 
    --output_dir ./ckpts/ 
    --num_train_epochs 3 
    --per_device_train_batch_size 8 
    --gradient_accumulation_steps 8 
    --evaluation_strategy " no " 
    --save_strategy " no " 
    --learning_rate 5e-4 
    --weight_decay 0. 
    --warmup_ratio 0.03 
    --lr_scheduler_type " cosine " 
    --logging_steps 50 
    --tf32 True

使用例：

 import transformers
from peft import PeftModel

# Where peft_model_id should be the saving directory or huggingface model id
model_name = "google/flan-t5-large" ; peft_model_id = "reasonwang/flan-alpaca-lora-large"
tokenizer = transformers . AutoTokenizer . from_pretrained ( model_name )
base_model = transformers . AutoModelForSeq2SeqLM . from_pretrained ( model_name )
peft_model = PeftModel . from_pretrained ( base_model , peft_model_id )

# Input an instruction or any other questions.
inputs = tokenizer ( "List a few tips to get good scores in math." , return_tensors = "pt" )
outputs = peft_model . generate ( ** inputs , max_length = 128 , do_sample = True )
print ( tokenizer . batch_decode ( outputs , skip_special_tokens = True ))