Este proyecto implementa un sistema de respuesta (QA) para la documentación CUDA. Ratea la documentación de NVIDIA CUDA, procesa los datos, los almacena en una base de datos vectorial y utiliza técnicas de recuperación avanzadas para responder consultas de los usuarios.
Las principales dependencias para este proyecto son:
Para obtener una lista completa de dependencias, consulte el archivo requirements.txt .
Asegúrese de tener un servidor Milvus en ejecución. Consulte la documentación de Milvus para obtener instrucciones de instalación y configuración.
Ejecute el script principal: 3. El sistema comenzará arrastrando la documentación CUDA, procesando los datos y almacenándolo en la base de datos de Milvus. Esta configuración inicial puede llevar algo de tiempo.
Una vez que se completa la configuración, puede comenzar a hacer preguntas sobre CUDA. El sistema proporcionará respuestas basadas en la información recuperada.
Para salir del sistema, escriba 'renunciar' cuando se le solicite una pregunta.
main.py : el script principal que orquesta todo el proceso.crawler/web_crawler.py : contiene la lógica de rastreo web.data_processing/chunking.py : implementa técnicas avanzadas de fragmentación de datos.data_processing/embedding.py : maneja la creación de embedidas vectoriales.vector_db/milvus_db.py : administra interacciones con la base de datos Milvus.retrieval/query_expansion.py : implementa técnicas de expansión de consultas.retrieval/hybrid_retrieval.py : contiene la lógica de recuperación híbrida.qa/llm_qa.py : administra el proceso de respuesta de la pregunta utilizando un modelo de idioma. SentenceTransformer en main.pycrawl_data (actualmente establecida en 5 niveles).top_k en la llamada del método retrieve . Si encuentra algún problema:
Para cualquier problema persistente, abra un problema en el repositorio de GitHub.