flan alpaca lora Téléchargement - flan alpaca lora Code source Télécharger

flan alpaca lora

Code Source AI

1.0.0

Télécharger

??? Flan-Alpaca-Lora: réglage des instructions des humains et des machines avec une adaptation de faible rang

Ce repo forme Google / Flan-T5 sur un ensemble de données Alpaca avec une méthode de formation d'adaptation de faible rang. Il réduit la mémoire GPU nécessaire et accélère l'entraînement.

17 juin 2023: Ajouter un cahier. Vous pouvez essayer Flan-Alpaca-Lora avec maintenant.

3 mai 2023: Train Flan-T5-XL à l'aide d'un ensemble de données Alpaca-GPT4.

13 avril 2023: Train Flan-T5-XL à l'aide d'un ensemble de données GPTeacher (Instruct and Roleplay), qui semble bien fonctionner.

5 avril 2023: Train Flan-T5-XXL en utilisant la quantification 8 bits. Le modèle peut être installé dans un seul GPU 3090. Tous les modèles peuvent être trouvés dans HuggingFace.

modèle	adaptateur_params	données	GPU	temps
Flan-alpaca-lora-base	0,9 m	Alpaga nettoyé	3090	20 minutes
Flan-Alpaca-Lora-Large	2,4 m	Alpaga nettoyé	3090	50 minutes
flan-alpaca-lora-xl	4,7 m	Alpaga nettoyé	3090	2,5 heures
flan-alpaca-lora-xxl	9.4m	Alpaga nettoyé	3090	10h
flan-gptacher-lora-xl	4,7 m	Gptacher	3090	80 minutes
flan-alpaca-gpt4-lora-xl	4,7 m	alpaga-gpt4	3090	3,25 heures

Dépendances

 torch == 1.13.1
transformers == 4.29.1
peft == 0.3.0
bitsandbytes==0.38.1
accelerate==0.19.0

La nouvelle version de ces packages devrait bien fonctionner.

Entraînement

La commande de commande flantutune Flan-T5 suivante avec seulement 20 minutes sur un seul GPU 3090

python train.py 
    --model_name_or_path google/flan-t5-base 
    --data_path ./alpaca_data_cleaned.json 
    --bf16 True 
    --output_dir ./ckpts/ 
    --num_train_epochs 3 
    --per_device_train_batch_size 8 
    --gradient_accumulation_steps 8 
    --evaluation_strategy " no " 
    --save_strategy " no " 
    --learning_rate 5e-4 
    --weight_decay 0. 
    --warmup_ratio 0.03 
    --lr_scheduler_type " cosine " 
    --logging_steps 50 
    --tf32 True

Exemple d'utilisation:

 import transformers
from peft import PeftModel

# Where peft_model_id should be the saving directory or huggingface model id
model_name = "google/flan-t5-large" ; peft_model_id = "reasonwang/flan-alpaca-lora-large"
tokenizer = transformers . AutoTokenizer . from_pretrained ( model_name )
base_model = transformers . AutoModelForSeq2SeqLM . from_pretrained ( model_name )
peft_model = PeftModel . from_pretrained ( base_model , peft_model_id )

# Input an instruction or any other questions.
inputs = tokenizer ( "List a few tips to get good scores in math." , return_tensors = "pt" )
outputs = peft_model . generate ( ** inputs , max_length = 128 , do_sample = True )
print ( tokenizer . batch_decode ( outputs , skip_special_tokens = True ))

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-03
taille 13.55MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Balle d'alpaga : Allstars

2022-08-08

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout