À propos
Ce référentiel contient une application Chatbot construite à l'aide de Streamlit, Langchain et ChromAdb, conçue pour fournir des informations importantes sur Covid-19 en fonction du contenu des fichiers PDF. Le chatbot utilise une approche de génération (RAG) (RAG) de récupération, le cas échéant des informations pertinentes à partir d'une base de données vectorielle, puis traitées par un modèle de langue pour générer une réponse finale.
Table des matières
- Caractéristiques
- Architecture
- Installation
- Usage
- Déploiement
- Contribution
- Travail futur
Caractéristiques
- Ingestion PDF: le chatbot peut ingérer des fichiers PDF contenant des informations liées à Covid-19 et créer une base de données vectorielle à l'aide de ChromAdB.
- Réponse de questions: les utilisateurs peuvent poser des questions liées à Covid-19, et le chatbot récupérera les informations pertinentes de la base de données vectorielle et générera une réponse à l'aide d'un modèle de langue.
- Interface rationalisée: le chatbot a une interface conviviale conçue avec Streamlit, permettant aux utilisateurs d'interagir avec l'application via une interface Web.
Architecture
Le chatbot suit une approche de génération de la récupération (RAG), qui combine des techniques de récupération et de génération pour fournir des réponses précises et pertinentes. L'architecture se compose des composants suivants:
- Chargeur de documents: charge les fichiers PDF du dossier des livres et les divise en morceaux de texte plus petits.
- Base de données vectorielle: les morceaux de texte sont convertis en incorporations vectorielles à l'aide d'embeddings d'OpenAI et stockées dans une base de données vectorielle ChromADB.
- Recherche de similitude: Lorsqu'un utilisateur pose une question, des morceaux de texte pertinents sont récupérés de la base de données vectorielle en fonction de leur similitude avec la question.
- Modèle de langue: les morceaux de texte récupérés sont transmis à un modèle de langue (GPT-3.5-turbo) ainsi que la question de l'utilisateur. Le modèle génère une réponse finale basée sur le contexte fourni.
- Interface rationalisée: l'interface utilisateur est construite à l'aide de Streamlit, permettant aux utilisateurs d'interagir avec le chatbot via une interface Web.
Installation
- Cloner la référentiel:
git clone https://github.com/saral7293/COVID-19-CHATBOT-Retrieval-Augmented-Generation-
- Accédez au répertoire du projet:
cd COVID-19-CHATBOT-Retrieval-Augmented-Generation
- Installez les dépendances requises:
pip install -r requirements.txt
- Définissez votre clé API OpenAI comme variable d'environnement:
export OPENAI_API_KEY=your_openai_api_key
Usage
Pour exécuter le chatbot localement à l'aide de Streamlit, exécutez la commande suivante:
Cela démarrera l'application Streamlit et vous pouvez interagir avec le chatbot via l'interface Web.
Déploiement
Ce chatbot a été déployé sur une instance EC2 dans une machine virtuelle.
Contribution
Les contributions sont les bienvenues! Si vous trouvez des problèmes ou souhaitez ajouter de nouvelles fonctionnalités, veuillez ouvrir un problème ou soumettre une demande de traction.
Travail futur
Affinez le chatbot et appliquez des techniques de chiffon avancé.