Introducción
La calculadora de IA inspirada en Apple es un proyecto avanzado diseñado para abordar problemas matemáticos utilizando tecnología de vanguardia. Al aprovechar la visión por computadora a través de OpenCV y la IA generativa a través de la IA Gemini de Google, esta calculadora permite a los usuarios dibujar expresiones matemáticas directamente en la pantalla. El modelo AI interpreta estas entradas visuales para ofrecer soluciones precisas y detalladas, lo que hace que los cálculos complejos sean intuitivos y accesibles. Inspirada en la funcionalidad de la calculadora de iPad de Apple, este proyecto mejora la experiencia del usuario con capacidades de IA sofisticadas, proporcionando precisión y facilidad de uso.
Tabla de contenido
Tecnologías y habilidades clave
Instalación
Para ejecutar este proyecto, debe instalar los siguientes paquetes:
pip install opencv - python
pip install pillow
pip install mediapipe
pip install google - generativeai
pip install numpy
pip install streamlit
pip install streamlit_extrasUso
Para usar este proyecto, siga estos pasos:
git clone https://github.com/gopiashokan/Apple-Inspired-AI-Calculator.gitpip install -r requirements.txt.env .streamlit run app.pyhttp://localhost:8501Características
Inicialización de la cámara web: utiliza OpenCV para inicializar y acceder a la cámara web, lo que permite la captura continua de la alimentación de video en vivo. Esta configuración garantiza la interacción en tiempo real con la entrada del usuario.
Procesamiento del marco de imagen: captura cada marco de imagen en el formato BGR predeterminado y aplica pasos de preprocesamiento esenciales. Esto incluye cambiar el tamaño de la uniformidad, el volteo para la orientación correcta y la conversión al formato RGB para alinearse con los requisitos de entrada del modelo AI.
Detección de gestos manuales: utiliza MediaPipe para identificar y rastrear los gestos de las manos en tiempo real. Esta biblioteca permite una detección precisa de puntos de referencia de manos, lo que permite que el sistema interprete varios movimientos y posiciones de los dedos.
Visualización y extracción histórica: dibuja puntos de referencia en la mano detectada y extrae las coordenadas de origen de cada punto de referencia. Estas coordenadas son cruciales para reconocer con precisión los gestos, que a su vez controlan las diferentes funcionalidades dentro de la aplicación.
Gestión del lienzo: establece un lienzo de dibujo dedicado que superpone la feed de video en vivo. Este lienzo permite a los usuarios dibujar problemas matemáticos directamente en la pantalla, proporcionando una experiencia perfecta e interactiva.
Mezcla de imágenes: integra el contenido dibujado con la alimentación de video en vivo mediante la combinación de ambas imágenes. Este proceso asegura que los dibujos del usuario se muestren con precisión en la parte superior de la alimentación viva, manteniendo una presentación visual clara y cohesiva.
Configuración de API y inicialización del modelo: configura la biblioteca de AI generativa de Google integrándola con una clave API válida. Inicializa el modelo Gemini 1.5 Flash , configurándolo para procesar y analizar los datos de entrada del dibujo.
Generación de soluciones: envía la imagen procesada junto con la solicitud de entrada al modelo AI. Genera soluciones detalladas para los problemas matemáticos representados, proporcionando resultados precisos e integrales basados en la entrada visual.
Interfaz interactiva: desarrollada usando Streamlit, esta aplicación ofrece una interfaz fácil e interactiva. Integra perfectamente todas las características del proyecto, lo que permite a los usuarios interactuar fácilmente con la calculadora de IA y realizar tareas como dibujo, control de gestos y soluciones de visualización.
Interacción en tiempo real: la aplicación Streamlit proporciona comentarios y actualizaciones en tiempo real, asegurando que los usuarios puedan ver sus dibujos y resultados de inmediato. Esta interfaz dinámica mejora la experiencia general del usuario, por lo que es intuitiva y eficiente usar la calculadora con AI.
? Video de demostración del proyecto: https://youtu.be/hxfbblopn6i
Que contribuye
¡Las contribuciones a este proyecto son bienvenidas! Si encuentra algún problema o tiene sugerencias de mejoras, no dude en enviar una solicitud de extracción.
Licencia
Este proyecto tiene licencia bajo la licencia MIT. Revise el archivo de licencia para obtener más detalles.
Contacto
? Correo electrónico: [email protected]
LinkedIn: Linkedin.com/in/gopiashokan
Para obtener más preguntas o consultas, no dude en comunicarse. Estamos felices de ayudarlo con cualquier consulta.