介紹
蘋果風格的AI計算器是一個高級項目,旨在使用最先進的技術解決數學問題。通過通過OPENCV和通過Google的Google的Gemini AI來利用計算機視覺,該計算器允許用戶直接在屏幕上繪製數學表達式。 AI模型將這些視覺輸入解釋以提供準確詳細的解決方案,從而使復雜的計算直觀且易於訪問。受Apple iPad計算器功能的啟發,該項目通過精緻的AI功能增強了用戶體驗,提供了精確和易用性。
目錄
關鍵技術和技能
安裝
要運行此項目,您需要安裝以下軟件包:
pip install opencv - python
pip install pillow
pip install mediapipe
pip install google - generativeai
pip install numpy
pip install streamlit
pip install streamlit_extras用法
要使用此項目,請執行以下步驟:
git clone https://github.com/gopiashokan/Apple-Inspired-AI-Calculator.gitpip install -r requirements.txt.env文件中。streamlit run app.pyhttp://localhost:8501在瀏覽器中訪問該應用程序特徵
網絡攝像頭初始化:利用OPENCV來初始化和訪問網絡攝像頭,從而可以連續捕獲實時視頻提要。此設置可確保與用戶輸入的實時互動。
圖像框架處理:以默認BGR格式捕獲每個圖像框架,並應用基本的預處理步驟。這包括調整均勻性的大小,翻轉以正確方向以及轉換為RGB格式以與AI模型的輸入要求保持一致。
手勢檢測:利用MediaPipe實時識別和跟踪手勢。該庫可以精確檢測手部地標,使系統可以解釋各種手指的運動和位置。
具有里程碑意義的可視化和提取:在檢測到的手上繪製地標,並提取每個地標的原點坐標。這些坐標對於準確識別手勢至關重要,這反過來又控制應用程序中的不同功能。
帆布管理:建立一個專用的繪圖畫布,覆蓋了實時視頻供稿。該畫布允許用戶直接將數學問題直接繪製到屏幕上,從而提供無縫互動的體驗。
圖像混合:通過混合兩個圖像將繪製的內容與實時視頻提要集成在一起。此過程確保用戶的圖紙準確地顯示在實時飼料頂部,並保持清晰且具有凝聚力的視覺呈現。
API設置和模型初始化:通過將其集成到有效的API密鑰來配置Google Generative AI庫。初始化Gemini 1.5 Flash模型,將其設置為處理並分析圖紙中的輸入數據。
解決方案生成:將處理的圖像以及輸入提示發送到AI模型。它為所描繪的數學問題生成詳細的解決方案,根據視覺輸入提供準確而全面的結果。
交互式界面:使用Sleatlit開發,此應用程序提供了用戶友好且交互式界面。它無縫地集成了所有項目的功能,使用戶可以輕鬆地與AI計算器進行交互,並執行諸如繪圖,手勢控制和查看解決方案之類的任務。
實時互動:簡化應用程序提供了實時反饋和更新,以確保用戶可以立即查看其圖紙和結果。這個動態接口增強了整體用戶體驗,使使用AI驅動計算器的直觀和高效。
?項目演示視頻:https://youtu.be/hxfbblopn6i
貢獻
歡迎對該項目的貢獻!如果您遇到任何問題或提出改進建議,請隨時提交拉動請求。
執照
該項目已根據MIT許可獲得許可。請查看許可證文件以獲取更多詳細信息。
接觸
?電子郵件:[email protected]
LinkedIn:LinkedIn.com/in/gopiashokan
對於任何其他問題或查詢,請隨時接觸。我們很樂意為您提供任何查詢。