Dieses Projekt ist ein RAG-System (Conversational Abruf-Augmented Generation), mit dem Benutzer PDF-Dateien hochladen, den Inhalt extrahieren und Fragen zum hochgeladenen Inhalt stellen können. Das System verfolgt den Chat -Verlauf und kontextualisiert Benutzerfragen basierend auf dem vergangenen Gespräch, um relevante Antworten zu geben.
Die Anwendung wird mit Stromversorgung für die Benutzeroberfläche erstellt, GROQ für das LLM (Sprachmodell) und Chroma als Vektorspeicher integriert, um Dokumenteinbettungen und Abrufen zu verarbeiten. Der Konversationsfluss wird mit Chat-Historie aufrechterhalten, um eine staatliche Fragen zu ermöglichen.
HuggingFaceEmbeddings , um Dokumenteneinbettungen zu erstellen und relevante Inhalte abzurufen. Um dieses Projekt auszuführen, benötigen Sie Folgendes:
Klonen Sie das Repository:
git clone https://github.com/yourusername/conversational-rag-with-pdf.git
cd conversational-rag-with-pdfErstellen Sie eine virtuelle Umgebung:
python3 -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`Installieren Sie die erforderlichen Abhängigkeiten:
pip install -r requirements.txtUmgebungsvariablen einrichten:
Erstellen Sie eine .env -Datei im Stammverzeichnis und fügen Sie Ihre API -Schlüssel hinzu:
touch .env Fügen Sie in der .env -Datei Folgendes hinzu:
HF_TOKEN=your_huggingface_token
GROQ_API_KEY=your_groq_api_keyFühren Sie die Anwendung aus:
streamlit run utils.pyWenn Sie die App starten, müssen Sie zunächst Ihre COQ -API -Taste eingeben. Dies ist erforderlich, um die Sprachmodellierung und Fragen zu beantworten.
Klicken Sie auf die Schaltfläche PDF -Datei auswählen, um eine oder mehrere PDF -Dateien hochzuladen. Der Inhalt der PDFs wird verarbeitet und für ein effizientes Abrufen in Stücke aufgeteilt.
Nach dem Hochladen von PDFs können Sie Fragen zum Inhalt der hochgeladenen Dateien stellen. Der Assistent antwortet basierend auf dem von PDFS und vorherigen Chat -Verlauf bereitgestellten Kontext.
Das System verfolgt den Gesprächsgeschichte. Sie können den Sitzungsverlauf anzeigen, und der Assistent verwendet diese Geschichte, um Folgefragen im Kontext zu beantworten.
Gemma2-9b-It Modells.Wenn Sie Probleme wie API -Schlüsselfehler oder Dateien hochladen, stellen Sie sicher, dass:
pip install -r requirements.txt korrekt installiert.txt.