Introdução
A calculadora de IA inspirada na Apple é um projeto avançado projetado para resolver problemas matemáticos usando a tecnologia de ponta. Ao alavancar a visão computacional através do OpenCV e da IA generativa através da AI Gemini do Google, esta calculadora permite que os usuários desenhem expressões matemáticas diretamente na tela. O modelo de IA interpreta essas entradas visuais para fornecer soluções precisas e detalhadas, tornando os cálculos complexos intuitivos e acessíveis. Inspirado na funcionalidade da calculadora do Apple iPad, este projeto aprimora a experiência do usuário com recursos sofisticados de IA, fornecendo precisão e facilidade de uso.
Índice
Tecnologias e habilidades principais
Instalação
Para executar este projeto, você precisa instalar os seguintes pacotes:
pip install opencv - python
pip install pillow
pip install mediapipe
pip install google - generativeai
pip install numpy
pip install streamlit
pip install streamlit_extrasUso
Para usar este projeto, siga estas etapas:
git clone https://github.com/gopiashokan/Apple-Inspired-AI-Calculator.gitpip install -r requirements.txt.env .streamlit run app.pyhttp://localhost:8501Características
Inicialização da webcam: utiliza o OpenCV para inicializar e acessar a webcam, permitindo a captura contínua de feed de vídeo ao vivo. Essa configuração garante a interação em tempo real com a entrada do usuário.
Processamento do quadro da imagem: captura cada quadro de imagem no formato BGR padrão e aplica etapas essenciais de pré -processamento. Isso inclui redimensionar a uniformidade, o inversão para a orientação correta e a conversão em formato RGB para se alinhar com os requisitos de entrada do modelo de IA.
Detecção de gestos manuais: utiliza MediaPipe para identificar e rastrear gestos manuais em tempo real. Esta biblioteca permite a detecção precisa de marcos de mão, permitindo que o sistema interprete vários movimentos e posições dos dedos.
Visualização e extração marcantes: desenha marcos na mão detectada e extrai as coordenadas de origem de cada marco. Essas coordenadas são cruciais para reconhecer com precisão os gestos, que por sua vez controlam diferentes funcionalidades dentro do aplicativo.
Gerenciamento de lona: estabelece uma tela de desenho dedicada que sobrepõe o feed de vídeo ao vivo. Essa tela permite que os usuários desenhem problemas matemáticos diretamente na tela, proporcionando uma experiência perfeita e interativa.
Mistura de imagens: integra o conteúdo desenhado com o feed de vídeo ao vivo, misturando as duas imagens. Esse processo garante que os desenhos do usuário sejam exibidos com precisão na parte superior do feed ao vivo, mantendo uma apresentação visual clara e coesa.
Configuração da API e inicialização do modelo: configura a biblioteca de IA generativa do Google, integrando -a com uma chave de API válida. Inicializa o modelo Gemini 1.5 Flash , configurando -o para processar e analisar dados de entrada do desenho.
Geração da solução: envia a imagem processada junto com o prompt de entrada para o modelo de IA. Ele gera soluções detalhadas para os problemas matemáticos retratados, fornecendo resultados precisos e abrangentes com base na entrada visual.
Interface interativa: desenvolvido usando o streamlit, este aplicativo oferece uma interface amigável e interativa. Ele integra perfeitamente todos os recursos do projeto, permitindo que os usuários interajam facilmente com a calculadora da IA e executem tarefas como desenho, controle de gestos e soluções de visualização.
Interação em tempo real: o aplicativo Streamlit fornece feedback e atualizações em tempo real, garantindo que os usuários possam ver seus desenhos e resultados imediatamente. Essa interface dinâmica aprimora a experiência geral do usuário, tornando-o intuitivo e eficiente para usar a calculadora movida a IA.
? Vídeo de demonstração do projeto: https://youtu.be/hxfbblopn6i
Contribuindo
As contribuições para este projeto são bem -vindas! Se você encontrar algum problema ou ter sugestões de melhorias, sinta -se à vontade para enviar uma solicitação de tração.
Licença
Este projeto está licenciado sob a licença do MIT. Revise o arquivo de licença para obter mais detalhes.
Contato
? E -mail: [email protected]
LinkedIn: LinkedIn.com/in/gopiashokan
Para outras perguntas ou consultas, fique à vontade para alcançar. Estamos felizes em ajudá -lo com qualquer dúvida.