Этот проект реализует систему ответа на вопрос (QA) для документации CUDA. Он сканирует документацию NVIDIA CUDA, обрабатывает данные, хранит их в векторной базе данных и использует расширенные методы поиска для ответа на запросы пользователей.
Основными зависимостями для этого проекта являются:
Для получения полного списка зависимостей см. Файл requirements.txt .
Убедитесь, что у вас работает сервер Milvus. Обратитесь к документации Milvus для установки и настройки инструкций.
Запустите основной сценарий: 3. Система начнется с ползания документации CUDA, обработки данных и хранения в базе данных Milvus. Эта первоначальная настройка может занять некоторое время.
После завершения настройки вы можете начать задавать вопросы о CUDA. Система предоставит ответы на основе полученной информации.
Чтобы выйти из системы, введите «уйти», когда будет предложено на вопрос.
main.py : основной сценарий, который организует весь процесс.crawler/web_crawler.py : содержит логику ползания.data_processing/chunking.py : реализует передовые методы Chunking Data.data_processing/embedding.py : обрабатывает создание векторных внедрений.vector_db/milvus_db.py : управляет взаимодействиями с базой данных Milvus.retrieval/query_expansion.py : реализует методы расширения запросов.retrieval/hybrid_retrieval.py : содержит гибридную логику поиска.qa/llm_qa.py : управляет процессом ответа на вопрос с использованием языковой модели. SentenceTransformer в main.pycrawl_data (в настоящее время установлена на 5 уровней).top_k в вызове метода retrieve . Если вы столкнетесь с какими -либо проблемами:
Для любых постоянных проблем, пожалуйста, откройте проблему в репозитории GitHub.