Dieses Projekt implementiert ein Fragen zur Beantwortung (QA) für die CUDA -Dokumentation. Es kriecht die NVIDIA CUDA -Dokumentation, verarbeitet die Daten, speichert sie in einer Vektor -Datenbank und verwendet erweiterte Abruftechniken, um Benutzeranfragen zu beantworten.
Die Hauptabhängigkeiten für dieses Projekt sind:
Eine vollständige Liste der Abhängigkeiten finden Sie in der Datei der requirements.txt .
Stellen Sie sicher, dass Sie einen Milvus -Server ausgeführt haben. In der Milvus -Dokumentation für Installations- und Setup -Anweisungen finden Sie in der Milvus -Dokumentation.
Führen Sie das Hauptskript aus: 3. Das System wird zunächst die CUDA -Dokumentation, die Verarbeitung der Daten und das Speichern in der Milvus -Datenbank durchkriechen. Dieses erste Setup kann einige Zeit dauern.
Sobald das Setup abgeschlossen ist, können Sie Fragen zu CUDA stellen. Das System bietet Antworten basierend auf den abgerufenen Informationen.
Um das System zu beenden, geben Sie "Beenden" ein, wenn Sie eine Frage aufgefordert haben.
main.py : Das Hauptskript, das den gesamten Prozess orchestriert.crawler/web_crawler.py : Enthält die Web -Crawling -Logik.data_processing/chunking.py : Implementiert erweiterte Daten -Chunking -Techniken.data_processing/embedding.py .vector_db/milvus_db.py : Verwaltet die Interaktionen mit der Milvus -Datenbank.retrieval/query_expansion.py : Implementierung von Abfragetechniken.retrieval/hybrid_retrieval.py : Enthält die Hybrid -Abruflogik.qa/llm_qa.py : Verwaltet den Fragebeantwortungsvorgang mit einem Sprachmodell. SentenceTransformer -Modell in main.py ändern.crawl_data angepasst werden (derzeit auf 5 Ebenen eingestellt).top_k im retrieve geändert wird. Wenn Sie auf Probleme stoßen:
Bei anhaltenden Problemen öffnen Sie bitte ein Problem im Github -Repository.