Unduh flan alpaca lora - Unduh Kode Sumber flan alpaca lora

flan alpaca lora

Kode Sumber AI

1.0.0

Unduh

??? flan-alpaca-lora: penyetelan instruksi dari manusia dan mesin dengan adaptasi peringkat rendah

Repo ini melatih Google/Flan-T5 pada dataset Alpaca dengan metode pelatihan adaptasi rendah. Ini mengurangi memori GPU yang dibutuhkan dan mempercepat pelatihan.

17 Juni 2023: Tambahkan buku catatan. Anda dapat mencoba Flan-Alpaca-Lora dengan sekarang.

3 Mei 2023: Latih Flan-T5-XL menggunakan dataset ALPACA-GPT4.

13 Apr 2023: Latih Flan-T5-XL menggunakan dataset GPTEACHER (Instruksi dan Roleplay), yang tampaknya berkinerja baik.

5 Apr 2023: Latih Flan-T5-XXL menggunakan kuantisasi 8bit. Model dapat dipasang ke dalam GPU 3090 tunggal. Semua model dapat ditemukan di tempat pelukan.

model	adapter_params	data	GPU	waktu
flan-alpaca-lora-base	0,9m	Alpaca dibersihkan	3090	20 menit
Flan-Alpaca-Lora-Large	2.4m	Alpaca dibersihkan	3090	50 menit
FLAN-ALPACA-LORA-XL	4.7m	Alpaca dibersihkan	3090	2.5 jam
FLAN-ALPACA-LORA-XXL	9.4m	Alpaca dibersihkan	3090	10 jam
Flan-Gpteacher-Lora-Xl	4.7m	GPTEACHER	3090	80 menit
Flan-Alpaca-Gpt4-Lora-Xl	4.7m	Alpaca-GPT4	3090	3.25 jam

Dependensi

 torch == 1.13.1
transformers == 4.29.1
peft == 0.3.0
bitsandbytes==0.38.1
accelerate==0.19.0

Versi terbaru dari paket ini harus berfungsi dengan baik.

Pelatihan

Perintah berikut FINETUNE FLAN-T5-BASE dengan hanya 20 menit pada GPU 3090 tunggal

python train.py 
    --model_name_or_path google/flan-t5-base 
    --data_path ./alpaca_data_cleaned.json 
    --bf16 True 
    --output_dir ./ckpts/ 
    --num_train_epochs 3 
    --per_device_train_batch_size 8 
    --gradient_accumulation_steps 8 
    --evaluation_strategy " no " 
    --save_strategy " no " 
    --learning_rate 5e-4 
    --weight_decay 0. 
    --warmup_ratio 0.03 
    --lr_scheduler_type " cosine " 
    --logging_steps 50 
    --tf32 True

Contoh Penggunaan:

 import transformers
from peft import PeftModel

# Where peft_model_id should be the saving directory or huggingface model id
model_name = "google/flan-t5-large" ; peft_model_id = "reasonwang/flan-alpaca-lora-large"
tokenizer = transformers . AutoTokenizer . from_pretrained ( model_name )
base_model = transformers . AutoModelForSeq2SeqLM . from_pretrained ( model_name )
peft_model = PeftModel . from_pretrained ( base_model , peft_model_id )

# Input an instruction or any other questions.
inputs = tokenizer ( "List a few tips to get good scores in math." , return_tensors = "pt" )
outputs = peft_model . generate ( ** inputs , max_length = 128 , do_sample = True )
print ( tokenizer . batch_decode ( outputs , skip_special_tokens = True ))

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-03
ukuran 13.55MB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Bola Alpaka: Allstars

2022-08-08

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua