Assistente de QA da empresa de ED-Tech
Este projeto é um assistente de controle de qualidade (perguntas de resposta), projetado para uma empresa de ED-Tech. Ele aproveita os bancos de dados de vetores, modelos de idiomas de última geração e incorporação de documentos personalizados para fornecer respostas precisas às consultas do usuário com base em uma base de conhecimento predefinida.
Índice
- Características
- Instalação
- Uso
- Estrutura do projeto
- Aprimoramentos futuros
- Contribuindo
- Licença
Características
- Banco de dados de vetores : utiliza o FAISS para uma pesquisa de similaridade eficiente na base de conhecimento.
- INCLIMENTOS CUDDADOS : Powered by HuggingFaceEmbeddings usando o modelo de transformadores de sentença/Minilm-L6-V2.
- Modelo de linguagem grande (LLM) : integra o modelo LLAMA3 da GROQ (LLAMA3-8B-8192) para gerar respostas com reconhecimento de contexto.
- Carregador de CSV : carrega perguntas frequentes ou outros dados estruturados de arquivos CSV para preencher a base de conhecimento.
- Interface simplitada : uma interface do usuário simples e interativa para fazer perguntas e receber respostas.
Instalação
- Clone o repositório:
git clone https : // github . com / shaadclt / Ed - Tech - Company - QA - Assistant . git
cd Ed - Tech - Company - QA - Assistant
- Configure um ambiente virtual:
python - m venv venv
source venv / bin / activate # On Windows, use `venvScriptsactivate`
- Instale dependências:
pip install - r requirements . txt
- Variáveis de ambiente: Crie um arquivo .env na raiz do projeto e adicione sua tecla API GROQ:
GROQ_API_KEY = your_groq_api_key_here
Uso
- Execute o aplicativo StreamLit
Crie a base de conhecimento: para criar a base de conhecimento a partir de um arquivo CSV, clique no botão Criar conhecimento
Faça uma pergunta: insira uma pergunta na interface do streamlit e o assistente fornecerá uma resposta contextualmente precisa com base na base de conhecimento carregada.
Estrutura do projeto
- Langchain_helper.py : contém a lógica para carregar dados, criar o banco de dados vetorial e gerar respostas.
- main.py : o arquivo de aplicativo STRYLIT.
- FAQS.CSV : Um arquivo de amostra CSV usado para preencher a base de conhecimento.
- requisitos.txt : lista todos os pacotes Python necessários.
- .env : armazena variáveis de ambiente como as chaves da API (não incluídas no repositório por razões de segurança).
Aprimoramentos futuros
- Expanda a base de conhecimento: adicione mais documentos ou fontes de dados.
- Modelos de ajuste fino: Ajuste as incorporações ou LLM para respostas mais precisas.
- UI avançada: melhore a interface do fluxo com recursos adicionais, como filtragem de respostas ou mecanismos de feedback.
Contribuindo
Sinta -se à vontade para gastar este repositório, criar uma filial de recursos e enviar uma solicitação de tração para obter aprimoramentos ou correções de bug.
Licença
Este projeto está licenciado sob a licença do MIT. Consulte o arquivo de licença para obter detalhes.