Ce référentiel documente mes progrès sur un cours d'ingénierie rapide, axé sur le développement de techniques et de stratégies pour travailler avec la dernière génération de modèles de langue générale (LLM).
Avec la publication de Chatgpt, les LLM sont devenues de plus en plus courantes, révolutionnant la façon dont nous interagissons avec les systèmes d'IA. Avant Chatgpt, il y a eu plusieurs progrès notables dans la PNL qui ont jeté les bases de cette révolution, y compris le document "l'attention est tout ce dont vous avez besoin" de Vaswani et. al., Bert, GPT-2, GPT-3, T5, Roberta, Electra et Albert. Bien que ces progrès soient très importants, ils peuvent ne pas être largement connus du grand public. L'année 2023 marque un tournant dans l'adoption de masse de ces modèles à usage général dans diverses industries pour des tâches génératives. En tant que scientifique des données, l'apprentissage continu est un attribut clé, et rester à la pointe des techniques LLM est essentiel pour fournir des solutions optimalement viables à l'ère du traitement du langage naturel axé sur l'IA.
L'objectif principal de ce cours est d'acquérir une compréhension approfondie des techniques d'ingénierie rapide pour une interaction efficace avec les LLM. En maîtrisant ces stratégies, je vise à améliorer ma capacité à développer des solutions innovantes, efficaces et efficientes en utilisant la puissance du langage naturel.
Ce référentiel est organisé dans les chapitres suivants: