Wizard_QLoRA_Finetuning Download - Wizard_QLoRA

Wizard_QLoRA_Finetuning

AI-Quellcode

1.0.0

Herunterladen

Wizard_Qlora_Finetuning

Flossen einige Zauberermodelle mit Qlora

Demo

https://youtu.be/hkt5nz0buso?si=hnmylp_z5sgzlmbm

Pipeline

Model Feinabstimmung

Fonetuning kann mit dem finetune.py -Skript durchgeführt werden. In diesem Skript wird ein Modell in einem der Datensätze in 4-Bit-Präzision heruntergeladen und finationstuniert. Wenn Feckergebnisse erzielt werden, werden Checkpoints im angegebenen Ausgabeverzeichnis gespeichert.

Verschmelzung

Nach dem Training des Modells sollte eine der Checkpoint -Dateien zusammengeführt werden, damit die Lora -Gewichte und alte Gewichte zu einer einzelnen Gewichtsmatrix kombiniert werden, was die Inferenz effizienter macht als wenn Sie sie geteilt haben. merge.py führt den Merge bei einer angegebenen Checkpoint -Datei und dem angegebenen Modelltyp durch.

Schlussfolgerung

Inferenz hat ein paar Skripte. infer.py und infer.ipynb sind ähnlich und laufen einfach geradezu in einem bestimmten Modell. infer_interface.ipynb verfügt über eine zusätzliche Schnittstelle mit Gradio.

Modelle hochladen/sparen

upload.py kann verwendet werden, um Huggingface -Modelle in den Hub hochzuladen, um einen Repo -Namen zum Hochladen zu erhalten. Stellen Sie sicher, dass Sie ein write -Token vom Umarmungsface zum richtigen Hochladen erhalten.