Internationale Sommerschule in Fortschritten in der KI
Großsprachige Modelle und wie man Unterricht einstellt (auf nachhaltige Weise)
Autoren : Danilo Croce
Vielen Dank an: Claudiu Daniel Hromei für die Unterstützung der Entwicklung von (meisten des) Code
In diesem Repository verfügt über Materialien aus dem Vortrag in der Sommerschule und in der von der Aixia organisierten AI 2024.
Das Ziel dieser Vorlesung ist:
- Führen Sie Transformator-basierte Architekturen ein , einschließlich Coding-Dekodierung, Nur-Decoder- und Decoder-Strukturen.
- Demonstrieren Sie die Feinabstimmung großer Sprachmodelle (LLMs) auf verschiedenen Datensätzen in einem Multi-Task-Framework.
- Verwenden Sie die Anpassung mit niedriger Rang (LORA) für eine nachhaltige und effiziente Abstimmung auf "bescheidener" Hardware (z. B. Single 16 GB RAM-GPU).
Das Repository enthält Code zur Feinabstimmung eines großen Sprachmodells (basierend auf LLAMA) zur Lösung von NLP-Aufgaben, wie beispielsweise die in Evalita 2023 vorgeschlagenen.
Code
Labor: Fein-Tune Ein Lama-basierter Modell für alle Aufgaben von Evalita 2023
Am Ende zeigt dieser Vortrag, wie Daten aus verschiedenen Aufgaben in bestimmte Eingabeaufforderungen codiert und die LLM mit q-Lora fein abteilen. Der Code kann auch in Google Colab mit einer NVIDIA-T4-GPU mit 15 GB Speicher verwendet werden.
Der Code basiert stark auf dem, der im Extremita -System verwendet wird, der an der Evalita 2023 teilnimmt:
- Extremita Papier
- Extremita Github Code
Der Gesamtprozess ist in vier Schritten geteilt:
- Schritt 1 - Codierung der Daten : Es zeigt, wie Daten aus einer Evalita -Aufgabe codiert werden, um Eingabeaufforderungen für die LLM zu generieren
- Schritt 2-Feinabstimmung des LLAMA-Modells : Es zeigt, wie die LLMs mit den Eingabeaufforderungen fein abgestimmen können
- Schritt 3 - Inferenz: Antworten generieren : Es zeigt, wie das mit Geldstrafe abgestimmte Modell verwendet wird
- SCHRITT 4 - DEKONDEN DIE Daten
Folien
Das Repository verfügt auch über Folien (Link).
Übertreffen
In den letzten Folien der Präsentation wird ein Ausflug vorgeschlagen.
Kontakte
Lösen Sie für Fragen oder Vorschläge ein Problem in diesem Repository oder senden Sie eine E -Mail an [email protected]