Les modèles de grandes langues offrent une étendue incroyable de connaissances dans à peu près tous les domaines. Dans ce projet, nous explorerons des méthodes pour augmenter les LLM avec des données personnalisées et la possibilité d'appeler des fonctions, l'objectif ultime étant d'améliorer leurs performances pour des tâches spécifiques liées au domaine.
Ce référentiel contient des cahiers de didacticiels alignés sur les leçons hebdomadaires du projet d'augmentation LLM (W24). Les ordinateurs portables sont conçus pour offrir une expérience pratique avec les technologies et les concepts que nous explorerons.
Pour commencer, clonez simplement le référentiel et utilisez les ordinateurs portables dans votre environnement de développement local. Si votre environnement local s'avère difficile, utilisez des ordinateurs portables cloud comme Google Colab ou Kaggle.
| Semaine | Date | Sujet hebdomadaire | Objectif |
|---|---|---|---|
| 1 | 2/11 | Configuration, introduction à LLMS et intégres | - |
| 2 | 2/18 | Bases de données vectorielles et génération augmentée (RAG) | - |
| - | - | Prise de printemps | - |
| 3 | 3/10 | Fonction Calling & Langchain | Groupes |
| 4 | 3/17 | Temps de développement | - |
| 5 | 3/24 | Temps de développement | - |
| 6 | 3/31 | Construire des fronts avec rationalisation | Point de contrôle de groupe dû |
| 7 | 4/7 | Temps de développement | - |
| 8 | 4/14 | Finale Expo Prep | Livrable final dû |
| - | - | Exposition finale du projet (4/19) | Présentation due |
Les clés API sont une partie essentielle du projet. Tout le monde recevra des clés API OpenAI et d'autres clés peuvent être disponibles sur demande si nécessaire pour les livrables.
Pour utiliser les clés API dans votre environnement de développement, définissez-les comme variables d'environnement système, soit créer un fichier .env dans votre dossier local et y définir vos variables d'environnement API. Vous trouverez ci-dessous un exemple de fichier .env et de code python tirant une clé API à partir du fichier.
Votre fichier .env devrait regarder ceci:
# .env
OPENAI_API_KEY = your_api_key
OTHER_API_KEYS = ...
... Pour extraire des variables d'environnement du .env dans votre code, vous voudrez utiliser la bibliothèque dotenv Python, comme ainsi.
from dotenv import load_dotenv
import os
load_dotenv () Une fois la cellule ci-dessus exécutée, toutes les variables d'environnement de la variable .env sont chargées dans les variables de votre environnement de cahier. Pour tirer ces variables d'environnement si nécessaire, utilisez os.getenv("OPENAI_API_KEY") .
Lorsque vous utilisez openai , la définition de la touche API doit ressembler à ceci:
import openai
openai . api_key = os . getenv ( "OPENAI_API_KEY" ) Lorsque vous utilisez langchain , load_dotenv() devrait suffire, car Langchain recherche automatiquement les variables d'environnement avec le nom approprié. Sinon, faites ce qui suit:
X_API_KEY = os . getenv ( "API_KEY_NAME" )
# then, pass the API KEY variable where necessary Ne code pas les touches API dans votre code ou incluez le fichier .env dans un engagement GIT.