selective peft toolkit -Download - selective peft toolkit -Quellcode herunterladen

selective peft toolkit

AI-Quellcode

1.0.0

Herunterladen

Selektives PEFT -Toolkit

Überblick

Willkommen im selective-peft-toolkit , der offiziellen Implementierung für das Papier "Schritt-für-Schritt-Entlarvung für parametereffiziente Feinabstimmungen großer Sprachmodelle" . Dieses Toolkit bietet ein flexibles Framework für die selektiv feine, große Sprachmodelle mit unterschiedlichen selektiven Parameter-effizienten Feinabstimmungsmethoden (PEFT).

Das Toolkit enthält die folgenden PEFT -Methoden:

FFT (vollständige Feinabstimmung)
ID3 (unsere vorgeschlagene Methode)
Pafi
Bitfit

Diese Methoden werden über ein Paket namens selective_optimizers ausgesetzt, das über PIP installiert werden kann:

pip install selective_optimizers

Schlüsselmerkmale

Selektive Optimierer : Wrapper um Standardoptimierer (Unterklassen von Torch.optim.optimizer), die eine budgetierte Anzahl von Parametern im Modell selektiv aktualisieren.
Heuristische Auswahl : Die selektiven Optimierer aktualisieren Parameter gemäß verschiedenen Heuristik- und Auswahlstrategien.
Integration mit Transformatoren : kompatibel mit Transformatoren.Trainer für eine einfache Integration in Ihre vorhandenen Pipelines.
Effiziente Speicherung : Speichert modifizierte Gewichte in einem zusammenfassenden Objekt, das nur O (b) Raum einnimmt, wobei B das Budget ist.

Installation

Um das Paket selective_optimizers zu installieren, führen Sie einfach aus:

pip install selective-optimizers

Verwendung

Trainings -Workflow

Hier ist ein grundlegender Workflow für das Training mit einem selektiven Optimierer:

 from selective_optimizers . wrap import get_selective_optimizer
from selective_optimizers . load_store import write_summary_to_disk
from torch . optim import AdamW

# Choose your base optimizer
opt = AdamW

# Specify the PEFT method to use (can be one of “fft”, “id3”, “bitfit”, or “pafi”)
peft_to_use = "id3"

# Get the selective optimizer class
optimizer_class = get_selective_optimizer ( opt , peft_to_use )

# Initialize the optimizer with additional selective parameters
optimizer = optimizer_class (
    params = model . parameters (), 
    lr = 0.0001 , 
    budget = 100000 , 
    exp = 0 , 
    eps = 1e-3 , 
    max_steps = 1000
)

# Usual training loop
...
...

# Optional post-training work for validation
optimizer . post_train_work ()
print ( "Budget used:" , optimizer . get_budget_used ())

# Save the summary of modified weights
summary = optimizer . get_summary ( model )
write_summary_to_disk ( "path/to/summary.pth" , summary )

Inferenz -Workflow

 from selective_optimizers . load_store import load_summary_from_disk , load_weights_from_summary

# Load your model as usual
...
model = ...
...

# Load the summary from disk
summary = load_summary_from_disk ( "path/to/summary.pth" )

# Apply the modified weights from the summary to the model
load_weights_from_summary ( model , summary )

# Usual inference code

...
...

Integration mit Transformatoren

Die transformators.trainer -Klasse akzeptiert externe Optimierer, so dass es einfach ist, selektive Optimierer in Ihren Workflow zu integrieren:

Erstellen Sie wie oben gezeigt einen selektiven Optimierer.
Geben Sie es an die Trainerklasse und rufen Sie .Train () darauf an.
Post -Training, abrufen und speichern Sie die Zusammenfassung wie oben beschrieben.
Laden Sie für Inferenz einfach die Zusammenfassung und aktualisieren Sie das Modell wie im Code gezeigt.

Beitragen

Wir begrüßen Beiträge zum Paket selective_optimizers! Wenn Sie einen neuen selektiven Optimierer hinzufügen möchten, befolgen Sie die folgenden Schritte:

Erstellen Sie eine neue Datei im Optimierer/ Ordner.
Subklass -Optimierer/Base_optimizer in Ihrer neuen Datei.
Überschreiben Sie init_chosen (), um die Anfangsmasken für die Parameter festzulegen.
Überschreiben Sie update_chosen (), um zu definieren, wie sich die Masken mit jedem Schritt entwickeln.
Bitte öffnen Sie eine Pull -Anfrage mit Ihrem neuen Optimierer, und wir werden es gerne überprüfen!

Lizenz

Dieses Projekt ist unter der MIT -Lizenz lizenziert. Weitere Informationen finden Sie in der Lizenzdatei.

Zitat

Wenn Sie dieses Toolkit in Ihrer Forschung verwenden, zitieren Sie bitte unser Papier:

@article{Agarwal2024_step_by_step,
  title = {Step - by - Step Unmasking for Parameter - Efficient Fine - tuning of Large Language Models},
  author = {Aradhye Agarwal and Suhas Kamasetty Ramesh and Ayan Sengupta and Tanmoy Chakraborty}
  journal = {arXiv preprint arXiv: 2408 . 14470 },
  year = { 2024 },
}