Введение
Вдохновленный Apple Calculator AI-это расширенный проект, предназначенный для решения математических задач с использованием передовых технологий. Используя компьютерное зрение через OpenCV и генеративный AI через AI Google Gemini, этот калькулятор позволяет пользователям рисовать математические выражения непосредственно на экране. Модель ИИ интерпретирует эти визуальные входы для предоставления точных и подробных решений, делая сложные расчеты интуитивными и доступными. Вдохновленный функциональностью калькулятора Apple iPad, этот проект улучшает пользовательский опыт со сложными возможностями ИИ, обеспечивая как точность, так и простоту использования.
Оглавление
Ключевые технологии и навыки
Установка
Чтобы запустить этот проект, вам нужно установить следующие пакеты:
pip install opencv - python
pip install pillow
pip install mediapipe
pip install google - generativeai
pip install numpy
pip install streamlit
pip install streamlit_extrasИспользование
Чтобы использовать этот проект, следуйте этим шагам:
git clone https://github.com/gopiashokan/Apple-Inspired-AI-Calculator.gitpip install -r requirements.txt.env .streamlit run app.pyhttp://localhost:8501Функции
Инициализация веб -камеры: использует OpenCV для инициализации и доступа к веб -камере, что позволяет непрерывно схватить прямую трансляцию видео. Эта настройка обеспечивает взаимодействие в реальном времени с входом пользователя.
Обработка кадров изображения: захватывает каждую кадр изображения в формате BGR по умолчанию и применяет важные шаги предварительной обработки. Это включает в себя изменение размера для однородности, переворот для правильной ориентации и преобразование в формат RGB, чтобы соответствовать требованиям ввода модели AI.
Обнаружение жестов рук: использует MediaPipe для выявления и отслеживания жестов рук в режиме реального времени. Эта библиотека обеспечивает точное обнаружение ручных достопримечательностей, позволяя системе интерпретировать различные движения и положения пальцев.
Ориентировочная визуализация и извлечение: привлечет достопримечательности на обнаруженной руке и извлекает координаты происхождения каждой достопримечательности. Эти координаты имеют решающее значение для точного распознавания жестов, которые, в свою очередь, контролируют различные функции в приложении.
Управление холстом: устанавливает выделенный холст рисования, который накладывает прямую трансляцию видео. Этот холст позволяет пользователям рисовать математические проблемы непосредственно на экране, обеспечивая бесшовный и интерактивный опыт.
Смешивание изображений: интегрирует нарисованный контент с прямым видео каналом, смешивая оба изображения. Этот процесс гарантирует, что чертежи пользователя точно отображаются поверх живого канала, поддерживая четкое и сплоченное визуальное представление.
Настройка API и инициализация модели: настраивает библиотеку Google Generative AI, интегрируя ее с действительным ключом API. Инициализирует модель Gemini 1.5 Flash , настраивая ее для обработки и проанализируйте входные данные с чертежа.
Генерация решения: отправляет обработанное изображение вместе с подсказкой ввода в модель ИИ. Он генерирует подробные решения для изображенных математических задач, предоставляя точные и всеобъемлющие результаты на основе визуального ввода.
Интерактивный интерфейс: разработан с использованием Streamlit, это приложение предлагает удобный и интерактивный интерфейс. Он плавно интегрирует все функции проекта, позволяя пользователям легко взаимодействовать с калькулятором ИИ и выполнять такие задачи, как рисунок, управление жестами и просмотр решений.
Взаимодействие в реальном времени: приложение Streamlit предоставляет обратную связь и обновления в реальном времени, гарантируя, что пользователи могут немедленно увидеть свои чертежи и результаты. Этот динамический интерфейс улучшает общий опыт пользователя, что делает его интуитивным и эффективным для использования калькулятора с AI.
? Демо -видео проекта: https://youtu.be/hxfbblopn6i
Внося
Вклад в этот проект приветствуются! Если вы сталкиваетесь с какими -либо проблемами или у вас есть предложения по улучшению, пожалуйста, не стесняйтесь отправлять запрос на привлечение.
Лицензия
Этот проект лицензирован по лицензии MIT. Пожалуйста, просмотрите файл лицензии для получения более подробной информации.
Контакт
? Электронная почта: [email protected]
LinkedIn: LinkedIn.com/in/gopiashokan
Для любых дополнительных вопросов или запросов не стесняйтесь обратиться. Мы рады помочь вам с любыми вопросами.