O Genaius KT é um chatbot de perguntas e respostas projetado para gerenciamento de conhecimento dentro de uma empresa. Auxilia os funcionários, especialmente estagiários e estagiários, na compreensão de projetos em andamento e anteriores. O chatbot responde a consultas relacionadas ao conteúdo educacional e aos detalhes do projeto, tornando a transferência de conhecimento perfeita e eficiente.
GenAIus/
├── backend/
│ ├── Data/
│ │ └── (Initial raw data of multiple formats)
│ ├── DataChunks/
│ │ └── (Extracted data chunks from all_extracted_data.txt)
│ ├── Downloads/
│ │ └── (Connected with MongoDB to download data)
│ ├── AllCleanData.txt
│ ├── ExtractedRawData.txt
│ ├── app.py
│ ├── cleaningChunks.py
│ ├── downloadRawFiles.py
│ ├── embeddings.json
│ ├── environment.yml
│ ├── extractor.py
│ ├── model.py
│ ├── ScrapeHTML.py
│ ├── splittingDataToChunks.py
│ └── uploadRawFiles.py
├── frontend/
│ └── (Next.js files)
├── README.md
└── LICENSEO oleoduto para o Genaius Chatbot consiste em várias etapas:
A primeira etapa do pipeline envolve a coleta de dados de vários documentos da empresa, incluindo:
Como os dados da empresa geralmente são confidenciais, os dados fictícios, mas realistas, foram criados nesses formatos.
A extração de dados textuais é executada usando várias bibliotecas Python, que leem o conteúdo de vários formatos de arquivo e salvam -os em um arquivo de texto consolidado ( ExtractedRawData.txt ). As bibliotecas usadas incluem:
osdocxcsvopenpyxlPyPDF2cv2pytesseractpptxselenium (para dados baseados na Web) Os dados textuais extraídos são pré -processados usando o modelo do Google Gemini AI. Dado o grande conjunto de dados, os dados são fundidos em peças menores e processados em lotes. Os dados limpos são salvos em um arquivo chamado AllCleanData.txt .
O projeto utiliza a chave da API Gemini para as peças de limpeza e treinamento de dados. Após clonar ou formar o projeto, substitua o espaço reservado no arquivo .env pela sua própria chave de API Gemini.
Depois que os dados são limpos, a próxima etapa é criar incorporações de vetor usando o modelo Gemini AI. O chatbot usa essas incorporações para recuperar informações relevantes com base nas consultas do usuário, garantindo que ele permaneça focado em seu domínio.
O back -end do frasco é responsável por conectar o front -end à lógica de processamento do chatbot. O back -end lida com solicitações e respostas entre a interface do usuário e o modelo AI.
A interface do usuário é criada usando o Next.js, fornecendo uma interface de bate-papo fácil de usar para os funcionários interagirem com o Genaius Chatbot. O design do front -end enfatiza a acessibilidade e a facilidade de uso.
Para configurar o projeto localmente, siga estas etapas:
Clone o repositório:
git clone https://github.com/Pree-04/Team-GenAIus
cd GenAIus
IMPORTANTE: Após a clonagem ou a forquilha do projeto, altere os diretórios e caminhos no código para refletir seus respectivos caminhos locais, onde você salvou os arquivos do projeto.
Instale dependências de back -end: CD Backend Pip Install -R requisitos.txt
Configure o front -end: CD Frontend NPM Instale
Crie um arquivo .env no diretório de back -end e adicione sua chave da API Gemini: GEMINI_API_KEY = Your_gemini_API_KEY_HERE
Para executar o servidor de back -end: CD Backend Python App.py
Para iniciar o front -end: CD Frontend NPM Run Dev
Visite http: // localhost: 3000 para interagir com o chatbot.
Integração de ponta a ponta: implante totalmente o aplicativo da Web com integração abrangente do chatbot para aprimorar sua acessibilidade. Controle de acesso hierárquico: implemente um recurso que restrinja o acesso a dados confidenciais com base na posição do funcionário dentro da organização. Isso garante que informações sensíveis sejam acessíveis apenas àqueles com a liberação apropriada.
As contribuições são bem -vindas! Crie uma solicitação de tração ou abra um problema para discussão.
Este projeto está licenciado sob a licença do MIT. Consulte o arquivo de licença para obter detalhes.