Um aplicativo Streamlit que usa bancos de dados de Langchain, OpenAI, GPT 3.5-Turbo e Pinecone Vector para processar um documento fornecido pelo usuário. O documento é dividido e depois convertido em incorporação de palavras usando o OpenAI INCEDDINGS. As incorporações são inseridas em um índice Pinecone que é excluído após o tempo de execução. Langchain é usado para recuperar informações através do controle de qualidade
Carregue o documento na barra lateral: .pdf, .docx e .txt Os arquivos são suportados. Você também pode controlar o tamanho do pedaço para melhorar a qualidade das respostas.
Use o streamlit run doc_chat.py para executar o aplicativo, fazer upload do documento e depois vá para conversar com o documento. Não se esqueça de excluir o índice Pinecone no final da sessão.