Este projeto implementa um sistema de resposta a perguntas (QA) para documentação do CUDA. Ele rasteja a documentação da NVIDIA CUDA, processa os dados, os armazena em um banco de dados vetorial e usa técnicas avançadas de recuperação para responder às consultas do usuário.
As principais dependências para este projeto são:
Para uma lista completa de dependências, consulte o arquivo requirements.txt .
Verifique se você tem um servidor Milvus em execução. Consulte a documentação do MILVUS para obter instruções de instalação e configuração.
Execute o script principal: 3. O sistema começará rastejando a documentação do CUDA, processando os dados e armazenando -os no banco de dados MILVUS. Essa configuração inicial pode levar algum tempo.
Depois que a configuração estiver concluída, você pode começar a fazer perguntas sobre CUDA. O sistema fornecerá respostas com base nas informações recuperadas.
Para sair do sistema, digite 'Quase' quando solicitado a uma pergunta.
main.py : o script principal que orquestra todo o processo.crawler/web_crawler.py : contém a lógica de rastreamento da web.data_processing/chunking.py : implementa técnicas avançadas de chunking de dados.data_processing/embedding.py : lida com a criação de incorporações de vetor.vector_db/milvus_db.py : gerencia interações com o banco de dados MILVUS.retrieval/query_expansion.py : implementa técnicas de expansão da Perfeição.retrieval/hybrid_retrieval.py : contém a lógica de recuperação híbrida.qa/llm_qa.py : gerencia o processo de resposta a perguntas usando um modelo de idioma. SentenceTransformer em main.pycrawl_data (atualmente definida como 5 níveis).top_k na chamada do método retrieve . Se você encontrar algum problema:
Para quaisquer problemas persistentes, abra um problema no repositório do GitHub.