مقدمة
حاسبة AI المستوحاة من Apple هي مشروع متقدم مصمم لمعالجة المشكلات الرياضية باستخدام التكنولوجيا المتطورة. من خلال الاستفادة من رؤية الكمبيوتر من خلال OpenCV و AI التوليدي عبر Google Gemini AI ، تتيح هذه الآلة الحاسبة للمستخدمين رسم تعبيرات رياضية مباشرة على الشاشة. يفسر نموذج الذكاء الاصطناعي هذه المدخلات البصرية لتقديم حلول دقيقة ومفصلة ، مما يجعل الحسابات المعقدة بديهية ويمكن الوصول إليها. مستوحى من وظائف حاسبة Apple iPad ، يعزز هذا المشروع تجربة المستخدم مع إمكانيات الذكاء الاصطناعي المتطورة ، مما يوفر الدقة وسهولة الاستخدام.
جدول المحتويات
التقنيات والمهارات الرئيسية
تثبيت
لتشغيل هذا المشروع ، تحتاج إلى تثبيت الحزم التالية:
pip install opencv - python
pip install pillow
pip install mediapipe
pip install google - generativeai
pip install numpy
pip install streamlit
pip install streamlit_extrasالاستخدام
لاستخدام هذا المشروع ، اتبع هذه الخطوات:
git clone https://github.com/gopiashokan/Apple-Inspired-AI-Calculator.gitpip install -r requirements.txt.env .streamlit run app.pyhttp://localhost:8501سمات
تهيئة كاميرا الويب: تستخدم OpenCV لتهيئة كاميرا الويب والوصول إليها ، مما يتيح التقاط مستمر من تغذية الفيديو الحية. يضمن هذا الإعداد التفاعل في الوقت الفعلي مع مدخلات المستخدم.
معالجة إطار الصورة: يلتقط كل إطار صورة بتنسيق BGR الافتراضي ويطبق خطوات المعالجة الأساسية الأساسية. يتضمن ذلك تغيير حجم التوحيد ، والتقليب للتوجه الصحيح ، والتحويل إلى تنسيق RGB للتوافق مع متطلبات إدخال نموذج الذكاء الاصطناعى.
الكشف عن لفتة اليد: يستخدم MediaPipe لتحديد وتتبع الإيماءات اليدوية في الوقت الفعلي. تتيح هذه المكتبة اكتشافًا دقيقًا لمعالم اليد ، مما يسمح للنظام بتفسير حركات ومواقف الأصابع المختلفة.
التصور التاريخي والاستخراج: يرسم المعالم على اليد المكتشفة ويستخرج إحداثيات المنشأ لكل معلم. هذه الإحداثيات مهمة للتعرف بدقة على الإيماءات ، والتي بدورها تتحكم في وظائف مختلفة داخل التطبيق.
إدارة قماش: تنشئ قماش رسم مخصص يتراكب تغذية الفيديو الحية. تتيح هذه القماش للمستخدمين رسم مشاكل رياضية مباشرة على الشاشة ، مما يوفر تجربة سلسة وتفاعلية.
مزج الصور: يدمج المحتوى المرسوم مع موجز الفيديو المباشر عن طريق مزج كلتا الصورتين. تضمن هذه العملية عرض رسومات المستخدم بدقة على أعلى الخلاصة الحية ، مع الحفاظ على عرض مرئي واضح ومتماسك.
إعداد API وتهيئة النموذج: يقوم بتكوين مكتبة Google Generative AI من خلال دمجها مع مفتاح API صالح. تهيئة نموذج Gemini 1.5 Flash ، وإعداده لمعالجة وتحليل بيانات الإدخال من الرسم.
توليد الحلول: يرسل الصورة المعالجة إلى جانب موجه الإدخال إلى نموذج الذكاء الاصطناعى. إنه يولد حلولًا مفصلة للمشاكل الرياضية الموضحة ، مما يوفر نتائج دقيقة وشاملة بناءً على المدخلات البصرية.
الواجهة التفاعلية: تم تطويره باستخدام STREMELIT ، ويوفر هذا التطبيق واجهة سهلة الاستخدام وتفاعلية. يدمج جميع ميزات المشروع بسلاسة ، مما يسمح للمستخدمين بالتفاعل بسهولة مع حاسبة الذكاء الاصطناعي وأداء المهام مثل الرسم والتحكم في الإيماءات ومشاهدة حلول.
التفاعل في الوقت الفعلي: يوفر تطبيق SPEREMLIT ملاحظات وتحديثات في الوقت الفعلي ، مما يضمن أن يتمكن المستخدمون من رؤية رسوماتهم ونتائجهم على الفور. تعزز هذه الواجهة الديناميكية تجربة المستخدم الإجمالية ، مما يجعلها بديهية وفعالة لاستخدام الآلة الحاسبة التي تعمل بالنيابة.
؟ مشروع الفيديو التجريبي: https://youtu.be/hxfbblopn6i
المساهمة
مساهمات في هذا المشروع مرحب بها! إذا واجهت أي مشكلات أو لديك اقتراحات للتحسينات ، فلا تتردد في تقديم طلب سحب.
رخصة
هذا المشروع مرخص بموجب ترخيص معهد ماساتشوستس للتكنولوجيا. يرجى مراجعة ملف الترخيص لمزيد من التفاصيل.
اتصال
؟ البريد الإلكتروني: [email protected]
LinkedIn: LinkedIn.com/in/gopiashokan
للحصول على أي أسئلة أو استفسارات أخرى ، لا تتردد في التواصل. يسعدنا مساعدتك في أي استفسارات.