Este projeto aproveita um agente de IA para extração e processamento automatizados de dados. O sistema permite que os usuários enviem um arquivo CSV ou conectem a uma planilha do Google e interaja com os dados usando consultas de linguagem natural. O agente gera código Python com base na consulta, executa o código para manipular os dados e apresenta o resultado em vários formatos, como uma tabela, plotagem ou string ou raspa dados úteis para o seu arquivo.
Para executar este projeto, você precisa de Python 3.7 ou posterior. O projeto usa várias bibliotecas de terceiros que podem ser instaladas via PIP.
git clone https://github.com/UjjawalGusain/CheatSheet-Langchain-Project.git
cd Langchain-Web-Agent python3 -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
pip install -r requirements.txtConfigure a API do Google Sheets:
Execute o aplicativo:
streamlit run dashboard.pyDepois de executar este comando, o aplicativo será iniciado e você poderá acessá -lo através do seu navegador.
Este projeto utiliza várias APIs para lidar com diferentes operações, incluindo raspagem de dados e interação com o modelo. As APIs integradas são:
API GROQ:
Modelo: llama-3.1-70b-versatile
Objetivo: A API Groq é usada para interagir com o modelo de linguagem grande para gerar respostas, executar operações no conjunto de dados e lidar com consultas complexas. O modelo LLAMA-3.1-70B-versátil é utilizado para a compreensão e geração de linguagem natural eficiente, ajudando a processar consultas e produzir resultados acionáveis.
Uso:
A API é chamada para processar consultas relacionadas aos dados, incluindo operações como extração, filtragem e resumos de geração. A resposta do modelo ajuda a moldar as operações aplicadas ao conjunto de dados.
Os avisos usados para o modelo são estruturados em um formato específico para garantir a resposta desejada e evitar erros durante a execução.
API raspadora:
Objetivo: A API de raspador é usada para coletar dados adicionais de fontes externas e anexar esses dados ao conjunto de dados.
Uso:
Selecione uma fonte de dados na barra lateral: faça o upload do CSV ou conecte as folhas do Google.
Digite uma consulta:
Ver Resultados:
Formatação e complexidade rápidas: um desafio significativo era garantir que os avisos passados para o modelo fossem formatados e manuseados corretamente pelo sistema. O modelo necessário para gerar respostas precisas com base na estrutura e complexidade das consultas. Também era importante manter a clareza e a consistência na maneira como as informações foram extraídas e apresentadas ao usuário, especialmente com consultas complexas.
Gerenciando riscos de segurança com LLMS: Aproveitando grandes modelos de linguagem (LLMS) introduziu riscos potenciais de segurança, particularmente em relação à privacidade de dados e ao tratamento de informações confidenciais. Garantir que nenhum dado confidencial ou privado fosse inadvertidamente exposto ao interagir com o modelo era um aspecto crítico do processo de desenvolvimento. Tivemos que implementar salvaguardas para minimizar esses riscos ao usar o LLMS para gerar código e processar dados.