Ce projet cherche à vous apprendre à créer des applications Python avec des fonctionnalités génératrices d'IA en utilisant les bibliothèques de Langchain et Transformers.
Bien qu'il existe une section pour OpenAI, la plupart du code qui existait auparavant, il y a été réutilisé et intégré aux bibliothèques Langchain ou Transformers. Ce projet comprend des extraits de code, des exemples de packages et des cahiers Jupyter que vous pouvez augmenter, copier ou apprendre respectivement.
Si vous êtes nouveau dans la création d'applications alimentées par AI, je vous suggère de commencer par jouer avec et d'exécuter le code dans les ordinateurs portables de Langchain. Voir le code en action, le modifier vous-même et réfléchir de manière créative de nouvelles idées est le meilleur moyen d'apprendre.
Vous trouverez ci-dessous des liens vers et des descriptions de sections de ce projet pour une navigation facile.
Ce réadme:
Langchain:
Extraits de code: vous trouverez ici des composants Python enfichables.
Notes de carnets: vous trouverez ici des cahiers Jupyter qui vous guident à travers l'utilisation de nombreuses classes Langchain différentes.
MergedDataLoader . Dans ce cahier, nous apprenons à cloner les référentiels GitHub et à gratter la documentation Web avant de les intégrer dans un VectorStore que nous utilisons ensuite comme Retriever. À la fin, vous devriez être à l'aise d'utiliser les sources comme contexte dans vos propres projets de chiffon.Exemples de bout en bout: Ici, vous trouverez des scripts conçus pour fonctionner hors de la boîte.
DirectoryLoader pour charger des fichiers pour la requête.PypdfDirectoryLoader pour charger des fichiers pour la requête.FacebookAISimilaritySearch pour charger des fichiers pour la requête.Pinecone "Index" comme retriever et discutez avec vos documents.Openai:
Extraits de code: vous trouverez ici des extraits de code à l'aide de la bibliothèque Openai Python.
Notes de carnets: vous trouverez ici des cahiers Jupyter qui vous montrent comment utiliser la bibliothèque Openai Python.
Transformers:
Extraits de code: vous trouverez ici des extraits de code à l'aide de la bibliothèque Transformers Python.
pipeline .Notes de carnets: vous trouverez ici des cahiers Jupyter qui vous montrent comment utiliser la bibliothèque Transformers Python.
Packages: Ici, vous trouverez des applications CLI.
Ce projet est développé à l'aide de PDM. Vous pouvez installer PDM à l'aide de pip :
Commencez par naviguer vers le répertoire racine de ce projet, puis exécutez:
pip install -U pdmVous devrez alors installer les dépendances à l'aide de PDM:
pdm install Cette commande créera un environnement virtuel dans .venv et installera les dépendances dans cet environnement. Si vous êtes sur macOS ou Linux, vous pouvez exécuter source .venv/bin/activate pour activer l'environnement. Sinon, vous pouvez exécuter la commande .venv/Scripts/activate ou .venv/Scripts/activate.ps1 pour activer l'environnement.
En utilisant un environnement virtuel, nous évitons de contaminer la contamination de notre environnement de python mondial.
Une fois notre environnement virtuel configuré, nous devons le sélectionner comme noyau pour le cahier Jupyter. Si vous êtes dans VSCODE, vous pouvez le faire en haut à droite du cahier. Si vous utilisez un IDE différent, vous devrez rechercher une aide à la configuration en ligne.
Lors de la sélection du noyau, assurez-vous de choisir celui qui se trouve à l'intérieur du répertoire .venv , et non l'environnement mondial Python.
Si vous êtes totalement nouveau dans la création d'applications alimentées par l'IA avec accès à des données externes, en particulier la récupération de la génération augmentée, consultez le cahier Rag Basics. C'est le cahier le plus simple, et ses concepts sont construits sur tous les autres cahiers «chiffons».
Cliquez sur le badge ci-dessous pour ouvrir le cahier de base de Rag Basics dans Colab.