Link do artigo
Este projeto Python demonstra pesquisa semântica usando o MongoDB e duas estruturas LLM diferentes: Langchain e Llamaindex . O objetivo é carregar documentos do MongoDB, gerar incorporações para os dados de texto e executar pesquisas semânticas usando as estruturas Langchain e Llandeindex .
Para executar este projeto, você precisa definir as seguintes variáveis de ambiente em um arquivo .env :
OPENAI_API_KEY = YOUR_OPENAI_API_KEY
MONGODB_URI = YOUR_MONGODB_CONNECTION_URI
MONGODB_COLL = YOUR_MONGODB_COLLECTION
MONGODB_VECTOR_INDEX = YOUR_MONGODB_VECTOR_INDEX
MONGODB_VECTOR_COLL_LANGCHAIN = YOUR_MONGODB_VECTOR_COLLECTION_LANGCHAIN
MONGODB_VECTOR_COLL_LLAMAINDEX = YOUR_MONGODB_VECTOR_COLLECTION_LLAMAINDEXCertifique -se de substituir os valores de espaço reservado pelas chaves da API e detalhes de conexão reais.
Instale dependências:
pip install -r requirements.txt
O projeto carrega documentos da coleção MongoDB especificada ( MONGODB_COLL ). Verifique se sua coleção MongoDB contém os dados de texto em que você deseja executar uma pesquisa semântica.
O aplicativo gera incorporações para os dados de texto carregados usando as estruturas Langchain e Llamaindex. As incorporações são armazenadas em coleções separadas do MongoDB ( MONGODB_VECTOR_COLL_LANGCHAIN e MONGODB_VECTOR_COLL_LLAMAINDEX ).
A pesquisa semântica é realizada usando as estruturas Langchain e Llandeindex. O processo envolve consultar a coleta de incorporação e a recuperação de documentos relevantes com base na similaridade semântica do prompt.
O OPENAI_API_KEY é necessário para incorporar a geração usando modelos de idioma externo (por exemplo, o GPT do OpenAI). Certifique -se de configurar detalhes e coleções de conexão do MongoDB adequadamente. Verifique a documentação oficial para Langchain e Llamaindex para obter detalhes adicionais de configuração ou uso.