Dieses Projekt implementiert ein KI-angetriebenes Dokument-Query-System mit Langchain, Chromadb und OpenAIs Sprachmodellen. Es ermöglicht Benutzern, eine durchsuchbare Datenbank aus Markdown -Dokumenten zu erstellen und sie mit natürlicher Sprache abzufragen.

requirements.txt aufgeführt sind.txt python -m venv .venv
source .venv/bin/activate # On Windows, use `.venvScriptsactivate`
pip install -r requirements.txt
.env -Datei ein: OPENAI_API_KEY=your_api_key_here
Befolgen Sie die folgenden Schritte, um die VectordB-LlM-Abfrage-Engine von RAG-basiertem Ragen schnell einzurichten und zu verwenden:
Erstellen Sie eine Datenbank aus Ihren Markdown -Dokumenten:
python create_database.py --data_folder data/go-docs --chroma_db_path chroma_go_docs/
In diesem Befehl verarbeitet die Markdown-Dateien im Verzeichnis data/ go-docs und erstellen eine Vektor-Datenbank im Ordner chroma_go_docs/ Ordner.
Fragen Sie die Datenbank mit einer natürlichen Sprachfrage ab:
python query_data.py --query_text "Explain goroutines in go in a sentence" --chroma_db_path chroma_go_docs/ --prompt_model gpt-3.5-turbo
Sehen Sie sich die AI-generierte Antwort an:
Goroutines are lightweight, concurrent functions or methods in Go that run independently, managed by the Go runtime, allowing for efficient parallel execution and easy implementation of concurrent programming patterns.
Weitere detailliertere Verwendungsanweisungen finden Sie in den folgenden Abschnitten:
Erstellen Sie die Datenbank
python create_database.py --data_folder path/to/your/markdown/files --chroma_db_path path/to/save/database
Fragen Sie die Datenbank ab
python query_data.py --query_text "Your question here" --chroma_db_path path/to/database --prompt_model gpt-3.5-turbo
create_database.py : Datenbankerstellungskriptquery_data.py : Datenbank -Abfrage -Skriptestimate_cost.py : Kostenschätzungsmodulget_token_count.py : Token Counting Utilitydata/ : Markdown -Dokumenteverzeichnischroma/ : Chromadb -Datenbankspeicher (gitigned) text-embedding-3-small für Einbettungen und gpt-3.5-turbo für Antworten standardmäßigdata/ oder geben Sie einen benutzerdefinierten Pfad anchroma/ (gitigned) gespeicherte Chromadb -Datenbank, die gespeichert ist Dieses Projekt ist gemäß den Bedingungen der MIT -Lizenz lizenziert. Weitere Informationen finden Sie in der Lizenzdatei.
Für Fragen oder Probleme öffnen Sie bitte ein Problem im Github -Repository.