Ссылка на статью
Этот проект Python демонстрирует семантический поиск с использованием MongoDB и двух разных структур LLM: Langchain и Llamaindex . Цель состоит в том, чтобы загрузить документы из MongoDB, генерировать вставки для текстовых данных и выполнить семантические поиски, используя как фреймворки Langchain , так и LamainDex .
Чтобы запустить этот проект, вам необходимо установить следующие переменные среды в файле .env :
OPENAI_API_KEY = YOUR_OPENAI_API_KEY
MONGODB_URI = YOUR_MONGODB_CONNECTION_URI
MONGODB_COLL = YOUR_MONGODB_COLLECTION
MONGODB_VECTOR_INDEX = YOUR_MONGODB_VECTOR_INDEX
MONGODB_VECTOR_COLL_LANGCHAIN = YOUR_MONGODB_VECTOR_COLLECTION_LANGCHAIN
MONGODB_VECTOR_COLL_LLAMAINDEX = YOUR_MONGODB_VECTOR_COLLECTION_LLAMAINDEXОбязательно замените значения заполнителей на фактические ключи API и детали соединения.
Установить зависимости:
pip install -r requirements.txt
Проект загружает документы из указанной коллекции MongoDB ( MONGODB_COLL ). Убедитесь, что ваша коллекция MongoDB содержит текстовые данные, в которых вы хотите выполнить семантический поиск.
Приложение генерирует встраиваемые для загруженных текстовых данных, используя фреймворки Langchain и Llamaindex. Встроения хранятся в отдельных коллекциях MongoDB ( MONGODB_VECTOR_COLL_LANGCHAIN и MONGODB_VECTOR_COLL_LLAMAINDEX ).
Семантический поиск выполняется с использованием фреймворков Langchain и Llamaindex. Процесс включает в себя запрос коллекции Enterdings и получение соответствующих документов, основанных на семантическом сходстве подсказки.
OPENAI_API_KEY необходим для внедрения генерации с использованием моделей внешнего языка (например, GPT OpenAI). Обязательно настройте сведения и коллекции подключения MongoDB соответствующим образом. Проверьте официальную документацию для Langchain и LlamainDex, чтобы узнать любую дополнительную конфигурацию или детали использования.