École d'été internationale en avancées dans l'IA
Modèles de grands langues et comment instructions les régler (de manière durable)
Auteurs : Danilo Croce
Un grand merci à: Claudiu Daniel Hromei pour avoir soutenu le développement de (la plupart du) code
Ce référentiel héberge des documents de la conférence organisée à l'école d'été et des avances dans l'IA 2024 organisées par l'Aixia.
L' objectif de cette conférence est:
- Introduisez des architectures basées sur les transformateurs , y compris les structures de décodage, de codage, d'encodeur uniquement et de décodeur.
- Démontrer le réglage fin des modèles de grande langue (LLM) sur divers ensembles de données dans un cadre multi-tâches.
- Utilisez une adaptation de faible rang (LORA) pour un réglage durable et efficace sur le matériel "modeste" (par exemple, un GPU de 16 Go unique de 16 Go).
Le référentiel comprend du code pour affiner un modèle de langue large (basé sur LLAMA) pour résoudre les tâches NLP, telles que celles proposées dans Evaluta 2023.
Code
Laborat: affinez un modèle basé sur un lama pour toutes les tâches de l'évaluation 2023
À la fin, cette conférence montre comment coder les données de différentes tâches dans des invites spécifiques et affiner le LLM en utilisant Q-Lora. Le code peut également être utilisé dans Google Colab à l'aide d'un GPU NVIDIA-T4 avec une mémoire de 15 Go.
Le code est fortement basé sur celui utilisé dans le système extrémite participant à Evaluta 2023:
- Papier à l'extrémité
- Code de github extrémiste
Le processus global est divisé en quatre étapes:
- Étape 1 - Encoder les données : il montre comment coder les données d'une tâche Evalua pour générer des invites pour le LLM
- Étape 2 - Fonctionner le modèle de lama : il montre comment affiner les LLMS compte tenu des invites
- Étape 3 - Inférence: génération de réponses : il montre comment utiliser le modèle à amende
- Étape 4 - Décondation des données : elle montre comment convertir les données à évaluer dans l'évaluation Evalus
Diapositives
Le référentiel dispose également de diapositives (lien).
Exercice
Un exercice est proposé dans les dernières diapositives de la présentation.
Contacts
Pour les requêtes ou les suggestions, soulevez un problème dans ce référentiel ou envoyez un courriel à [email protected]