Téléchargement selective peft toolkit - Téléchargement du code source selective peft toolkit

selective peft toolkit

Code Source AI

1.0.0

Télécharger

Boîte à outils PEFT sélective

Aperçu

Bienvenue dans le selective-peft-toolkit , la mise en œuvre officielle de l'article "démasquage étape par étape pour le réglage fin économe en paramètres des modèles de gros langues" . Cette boîte à outils fournit un cadre flexible pour les modèles de gros langage affinés sélectivement en utilisant différentes méthodes sélectives de réglage des paramètres (PEFT).

La boîte à outils comprend les méthodes PEFT suivantes:

FFT (réglage fin complet)
ID3 (notre méthode proposée)
Pafi
Bitfit

Ces méthodes sont exposées via un package appelé selective_optimizers , qui peut être installé via PIP:

pip install selective_optimizers

Caractéristiques clés

Optimisateurs sélectifs : emballages autour des optimisateurs standard (sous-classes de torch.optim.optimizer) qui mettent à jour sélectivement un nombre budgétaire de paramètres dans le modèle.
Sélection basée sur l'heuristique : les optimisateurs sélectifs mettent à jour les paramètres en fonction de diverses heuristiques et stratégies de sélection.
Intégration avec Transformers : Compatible avec Transformers.Trainer pour une intégration facile dans vos pipelines existants.
Stockage efficace : stocke des poids modifiés dans un objet récapitulatif qui n'occupe que l'espace O (b), où B est le budget.

Installation

Pour installer le package sélectif_optimizers, exécutez simplement:

pip install selective-optimizers

Usage

Flux de travail de formation

Voici un flux de travail de base pour la formation avec un optimiseur sélectif:

 from selective_optimizers . wrap import get_selective_optimizer
from selective_optimizers . load_store import write_summary_to_disk
from torch . optim import AdamW

# Choose your base optimizer
opt = AdamW

# Specify the PEFT method to use (can be one of “fft”, “id3”, “bitfit”, or “pafi”)
peft_to_use = "id3"

# Get the selective optimizer class
optimizer_class = get_selective_optimizer ( opt , peft_to_use )

# Initialize the optimizer with additional selective parameters
optimizer = optimizer_class (
    params = model . parameters (), 
    lr = 0.0001 , 
    budget = 100000 , 
    exp = 0 , 
    eps = 1e-3 , 
    max_steps = 1000
)

# Usual training loop
...
...

# Optional post-training work for validation
optimizer . post_train_work ()
print ( "Budget used:" , optimizer . get_budget_used ())

# Save the summary of modified weights
summary = optimizer . get_summary ( model )
write_summary_to_disk ( "path/to/summary.pth" , summary )

Flux de travail d'inférence

 from selective_optimizers . load_store import load_summary_from_disk , load_weights_from_summary

# Load your model as usual
...
model = ...
...

# Load the summary from disk
summary = load_summary_from_disk ( "path/to/summary.pth" )

# Apply the modified weights from the summary to the model
load_weights_from_summary ( model , summary )

# Usual inference code

...
...

Intégration avec les transformateurs

La classe Transformers.Trainer accepte des optimisateurs externes, ce qui facilite l'intégration d'optimiturs sélectifs dans votre flux de travail:

Créez un optimiseur sélectif comme indiqué ci-dessus.
Passez-le à la classe Trainer et appelez .Train () dessus.
Après l'entraînement, récupérer et stocker le résumé comme décrit ci-dessus.
Pour l'inférence, chargez simplement le résumé et mettez à jour le modèle comme indiqué dans le code.

Contributif

Nous saluons les contributions au package sélectif_optimizers! Si vous souhaitez ajouter un nouvel optimiseur sélectif, suivez ces étapes:

Créez un nouveau fichier à l'intérieur du dossier Optimizers /.
Sous-classe Optimizers / base_optimizer dans votre nouveau fichier.
Remplacez init_chosen () pour définir les masques initiaux pour les paramètres.
Remplacez Update_chosen () pour définir comment les masques évoluent à chaque étape.
Veuillez ouvrir une demande de traction avec votre nouvel optimiseur, et nous serons heureux de le revoir!

Licence

Ce projet est autorisé sous la licence du MIT. Voir le fichier de licence pour plus de détails.

Citation

Si vous utilisez cette boîte à outils dans votre recherche, veuillez citer notre article:

@article{Agarwal2024_step_by_step,
  title = {Step - by - Step Unmasking for Parameter - Efficient Fine - tuning of Large Language Models},
  author = {Aradhye Agarwal and Suhas Kamasetty Ramesh and Ayan Sengupta and Tanmoy Chakraborty}
  journal = {arXiv preprint arXiv: 2408 . 14470 },
  year = { 2024 },
}