Этот проект реализует систему запросов документов с AI с использованием моделей Langchain, Chromadb и Openai. Это позволяет пользователям создавать базу данных, доступную для поиска из документов Markdown, и запросить ее с использованием естественного языка.

requirements.txt python -m venv .venv
source .venv/bin/activate # On Windows, use `.venvScriptsactivate`
pip install -r requirements.txt
.env : OPENAI_API_KEY=your_api_key_here
Следуйте этим шагам, чтобы быстро настроить и использовать двигатель запроса VectordB-LLM на основе RAG:
Создайте базу данных из ваших документов Markdown:
python create_database.py --data_folder data/go-docs --chroma_db_path chroma_go_docs/
Эта команда будет обрабатывать файлы разметки в каталоге Data/ Go-Docs и создаст векторную базу данных в папке CROMA_GO_DOCS/.
Запросите базу данных с помощью вопроса о естественном языке:
python query_data.py --query_text "Explain goroutines in go in a sentence" --chroma_db_path chroma_go_docs/ --prompt_model gpt-3.5-turbo
Посмотреть сгенерированный AI ответ:
Goroutines are lightweight, concurrent functions or methods in Go that run independently, managed by the Go runtime, allowing for efficient parallel execution and easy implementation of concurrent programming patterns.
Для получения более подробных инструкций по использованию см. В следующих разделах:
Создайте базу данных
python create_database.py --data_folder path/to/your/markdown/files --chroma_db_path path/to/save/database
Запросите базу данных
python query_data.py --query_text "Your question here" --chroma_db_path path/to/database --prompt_model gpt-3.5-turbo
create_database.py : сценарий создания базы данныхquery_data.py : сценарий запроса базы данныхestimate_cost.py : модуль оценки затратget_token_count.py : утилита счета токенаdata/ : каталог документов Markdownchroma/ : хранение базы данных ChromADB (GITIGNORED) text-embedding-3-small Openai для встроений и gpt-3.5-turbo для ответов по умолчаниюdata/ или укажите пользовательский путьchroma/ (GitIgnored) Этот проект лицензирован в соответствии с условиями лицензии MIT. Для получения дополнительной информации, пожалуйста, обратитесь к файлу лицензии.
По вопросам или вопросам, пожалуйста, откройте проблему в репозитории GitHub.