Doctalk?
Doctalk ist eine streamlit-basierte Webanwendung, mit der Benutzer ihre Dokumente (PDF, DOCX, TXT) mit natürlichen Sprachabfragen hochladen und interagieren können. Die Anwendung nutzt das GPT-4O-Mini-Modell von OpenAI für Abfragevalidierung und Chating sowie Text-Embedding-3-Small, um Benutzeranfragen basierend auf dem Inhalt der hochgeladenen Dokumente zu verstehen und auf sie zu reagieren.
Merkmale
- Dokumente hochladen und verarbeiten : Laden Sie PDF-, DOCX- und TXT -Dateien für die Textbefestigung und -verarbeitung hoch.
- Benutzerdefinierte Chunking & Token -Zählung : Benutzerdefinierte Dokumente zur Verbesserung der Kontextabnahme und der Reaktionsgenerierung. Verwendet NLTKs Satz Tokenizer, um die Dokumente zu beurteilen.
- Chat mit Dokumenten : Stellen Sie Fragen zu Ihren hochgeladenen Dokumenten und erhalten Sie kontextbezogene Antworten.
- Ähnlichkeit der Cosinus für den Kontext -Abrufen : Verwendet die Ähnlichkeit der Kosinus, um die relevantesten Dokumentbrocken als Antwort auf Benutzeranfragen zu finden.
- Abfragevalidierung : Verwendet einen sekundären API -Aufruf, um zu validieren, ob eine Abfrage einen Dokumentenkontext benötigt, wodurch letztendlich Token spart und die Kosten gesenkt werden.
- Einfache App -Passcode -Authentifizierung : Der Zugriff auf die App wird von einem Passcode geschützt, um sicherzustellen, dass nur autorisierte Benutzer mit den Dokumenten interagieren können.
Installation
Klonen Sie das Repository :
git clone https://github.com/kmaurinjones/doc-talk.git
cd doc-talk
Erstellen Sie eine virtuelle Umgebung (optional, aber empfohlen):
python3 -m venv env
source env/bin/activate
Installieren Sie die erforderlichen Pakete :
pip install -r requirements.txt
Umgebungsvariablen
Erstellen Sie eine .env -Datei im Stammvermögen Ihres Projekts und fügen Sie die folgenden Umgebungsvariablen hinzu:
SIMPLE_AUTH_PASSCODE=your_passcode
OPENAI_API_KEY=your_openai_api_key
Vor Ort laufen
Verwenden Sie den folgenden Befehl, um die Anwendung lokal auszuführen:
Dadurch wird der StreamLit -Server gestartet und Sie können auf die App unter http://localhost:8501 zugreifen.
Zugriff auf die bereitgestellte App
Die Anwendung wird ebenfalls bereitgestellt und kann über die folgende URL: Doctalk -Bereitstellung zugegriffen werden
Verwendung
- Dokumente hochladen : Laden Sie PDF-, DOCX- oder TXT -Dateien mit dem Datei -Uploader in der App hoch.
- Verarbeiten von Dokumenten : Klicken Sie auf die Schaltfläche "Dokumente verarbeiten", um den Text aus den hochgeladenen Dateien zu extrahieren und zu verarbeiten.
- Chat mit Dokumenten : Verwenden Sie die Chat -Eingabe, um Fragen zum Inhalt der hochgeladenen Dokumente zu stellen. Die App liefert Antworten basierend auf dem verarbeiteten Text und Kontext aus den Dokumenten.
Beispiele
Hier sind einige Screenshots des in verwendeten Antrags von Doctalk:
Einfache Passcode -Benutzerauthentifizierung

Hochladen und Verarbeitung von Dokumenten

Abfrage- und Antwortkontext

Beitragen
Beiträge sind willkommen! Bitte öffnen Sie ein Problem oder senden Sie eine Pull -Anfrage für Verbesserungen oder Fehlerbehebungen.
Lizenz
Dieses Projekt ist unter der MIT -Lizenz lizenziert. Weitere Informationen finden Sie in der LICENSE .
Kontakt
Für Fragen oder Probleme kontaktieren Sie mich bitte unter [email protected]