O Langgraphrag é um sistema de geração de recuperação baseado em terminal (RAG) implementado usando o Langgraph. A arquitetura foi projetada para lidar com consultas, roteando -as através de uma série de processos que envolvem cache de histórico de mensagens, transformação de consulta e recuperação de documentos de um banco de dados vetorial.
O projeto é dividido em vários módulos, cada um responsável por funcionalidades específicas:
Siga estas etapas para configurar e executar o projeto:
Clone o repositório :
git clone https://github.com/ranguy9304/LangGraphRAG.git
cd LangGraphRAGCrie um ambiente virtual :
python3.12 -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`Instale os requisitos :
pip install -r requirements.txt
choco install wkhtmltopdfConfigure as variáveis de ambiente :
cp .env.example .env.env para adicionar sua tecla GPT: OPENAI_API_KEY = your_gpt_key_here URLS = url1,url2GET_WEB_PAGES_TO_PDF como true se baixar as páginas da web false: GET_WEB_PAGES_TO_PDF = False
CONVERT_PDF_TO_MD como true se já tiver pdf else false: CONVERT_PDF_TO_MD = True
INTERMEDIATE_PDF_DIRDATA_DIRDocumentos de configuração : a partir da execução do diretório raiz
python modules/processDocs.pyIsso configura as páginas da Web e os documentos. Não se esqueça de modificar os parâmetros de processamento de documentos em .env conforme suas necessidades.
Execute o programa principal :
python main.py

Sinta -se à vontade para bifurcar o repositório e enviar solicitações de tração. Para grandes mudanças, abra um problema para discutir o que você gostaria de mudar.
Mit