Um
Dieses Repository enthält eine Chatbot-Anwendung, die mit Streamlit, Langchain und Chromadb erstellt wurde, um wichtige Informationen zu CoVID-19 basierend auf dem Inhalt von PDF-Dateien bereitzustellen. Der Chatbot verwendet einen Ansatz (Abruf-Augmented-Generationed-Generation), sofern relevante Informationen aus einer Vektor-Datenbank abgerufen und dann von einem Sprachmodell verarbeitet werden, um eine endgültige Antwort zu generieren.
Inhaltsverzeichnis
- Merkmale
- Architektur
- Installation
- Verwendung
- Einsatz
- Beitrag
- Futurework
Merkmale
- PDF-Einnahme: Der Chatbot kann PDF-Dateien mit CoVID-19-verwandten Informationen einnehmen und eine Vektordatenbank mit Chromadb erstellen.
- Beantwortung von Fragen: Benutzer können Fragen zu CoVID-19 stellen, und der Chatbot ruft relevante Informationen aus der Vektor-Datenbank ab und generiert eine Antwort mit einem Sprachmodell.
- Streamlit-Schnittstelle: Der Chatbot verfügt über eine benutzerfreundliche Schnittstelle mit Streamlit, mit der Benutzer über eine webbasierte Schnittstelle mit der Anwendung interagieren können.
Architektur
Der Chatbot folgt einem Ansatz (Abruf-Augmented-Generationed Generationed Generationed Generation), der Abruf- und Generationstechniken kombiniert, um genaue und relevante Antworten zu liefern. Die Architektur besteht aus den folgenden Komponenten:
- Dokumentlader: Laden Sie PDF -Dateien aus dem Ordner "Bücher" und teilen Sie sie in kleinere Textbrocken auf.
- Vektordatenbank: Die Textbrocken werden unter Verwendung von OpenAIs Einbettungen in Vektor -Einbettungen konvertiert und in einer Chromadb -Vektor -Datenbank gespeichert.
- Ähnlichkeitssuche: Wenn ein Benutzer eine Frage stellt, werden relevante Textbrocken aus der Vector -Datenbank basierend auf seiner Ähnlichkeit mit der Frage abgerufen.
- Sprachmodell: Die abgerufenen Textbrocken werden zusammen mit der Frage des Benutzers an ein Sprachmodell (GPT-3,5-Turbo) übergeben. Das Modell generiert eine endgültige Antwort basierend auf dem bereitgestellten Kontext.
- Streamlit-Schnittstelle: Die Benutzeroberfläche wird mit streamlit erstellt, sodass Benutzer über eine webbasierte Oberfläche mit dem Chatbot interagieren können.
Installation
- Klonen Sie die Aufbewahrung:
git clone https://github.com/saral7293/COVID-19-CHATBOT-Retrieval-Augmented-Generation-
- Navigieren Sie zum Projektverzeichnis:
cd COVID-19-CHATBOT-Retrieval-Augmented-Generation
- Installieren Sie die erforderlichen Abhängigkeiten:
pip install -r requirements.txt
- Stellen Sie Ihre OpenAI -API -Schlüssel als Umgebungsvariable fest:
export OPENAI_API_KEY=your_openai_api_key
Verwendung
Führen Sie den folgenden Befehl aus, um den Chatbot lokal mit Streamlit auszuführen:
Dadurch startet die Streamlit -Anwendung und Sie können über die Weboberfläche mit dem Chatbot interagieren.
Einsatz
Dieser Chatbot wurde in einer EC2 -Instanz in einer VM bereitgestellt.
Beitrag
Beiträge sind willkommen! Wenn Sie Probleme finden oder neue Funktionen hinzufügen möchten, öffnen Sie bitte ein Problem oder senden Sie eine Pull -Anfrage.
Futurework
Feinstimmen Sie den Chatbot und wenden Sie die Vorab -Rag -Techniken an.