Sobre
Este repositório contém um aplicativo de chatbot construído usando o Streamlit, Langchain e Chromadb, projetado para fornecer informações importantes sobre o CoVID-19 com base no conteúdo dos arquivos PDF. O chatbot utiliza uma abordagem de geração de recuperação de recuperação (RAG), quando as informações relevantes são recuperadas de um banco de dados vetorial e depois processadas por um modelo de idioma para gerar uma resposta final.
Índice
- Características
- Arquitetura
- Instalação
- Uso
- Implantação
- Contribuição
- Futurework
Características
- Ingestão em PDF: O chatbot pode ingerir arquivos PDF contendo informações relacionadas ao CoVID-19 e criar um banco de dados vetorial usando o Chromadb.
- Resposta à pergunta: os usuários podem fazer perguntas relacionadas ao CoVID-19, e o chatbot recuperará informações relevantes do banco de dados do vetor e gerará uma resposta usando um modelo de idioma.
- Interface do streamlit: o chatbot possui uma interface amigável criada com o streamlit, permitindo que os usuários interajam com o aplicativo através de uma interface baseada na Web.
Arquitetura
O chatbot segue uma abordagem de geração de recuperação de recuperação (RAG), que combina técnicas de recuperação e geração para fornecer respostas precisas e relevantes. A arquitetura consiste nos seguintes componentes:
- Carregador de documentos: carrega arquivos PDF da pasta Livros e os divide em pedaços de texto menores.
- Banco de dados vetorial: os pedaços de texto são convertidos em incorporação de vetores usando as incorporações do OpenAI e armazenadas em um banco de dados do Chromadb Vector.
- Pesquisa de similaridade: Quando um usuário faz uma pergunta, os pedaços de texto relevantes são recuperados do banco de dados vetorial com base em sua semelhança com a pergunta.
- Modelo de idioma: Os pedaços de texto recuperados são passados para um modelo de idioma (GPT-3.5-Turbo) junto com a pergunta do usuário. O modelo gera uma resposta final com base no contexto fornecido.
- Interface do streamlit: A interface do usuário é criada usando o STRILYLIT, permitindo que os usuários interajam com o chatbot através de uma interface baseada na Web.
Instalação
- Clone a repositia:
git clone https://github.com/saral7293/COVID-19-CHATBOT-Retrieval-Augmented-Generation-
- Navegue até o diretório do projeto:
cd COVID-19-CHATBOT-Retrieval-Augmented-Generation
- Instale as dependências necessárias:
pip install -r requirements.txt
- Defina sua chave da API OpenAI como uma variável de ambiente:
export OPENAI_API_KEY=your_openai_api_key
Uso
Para executar o chatbot localmente usando o streamlit, execute o seguinte comando:
Isso iniciará o aplicativo StreamLit e você poderá interagir com o chatbot através da interface da web.
Implantação
Este chatbot foi implantado em uma instância do EC2 em uma VM.
Contribuição
As contribuições são bem -vindas! Se você encontrar algum problema ou desejar adicionar novos recursos, abra um problema ou envie uma solicitação de tração.
Futurework
Ajuste o chatbot e aplique técnicas antecipadas de pano.