أطلق فريق أبحاث الذكاء الاصطناعي التابع لشركة Apple نموذجًا جديدًا لتقدير العمق، Depth Pro، والذي حقق اختراقات كبيرة في السرعة والدقة. يمكن لهذا النموذج إنشاء خريطة عمق ثلاثية الأبعاد عالية الدقة من صورة ثنائية الأبعاد واحدة في 0.3 ثانية دون أي بيانات وصفية للكاميرا، ويمكنه التقاط تفاصيل دقيقة مثل الشعر والنباتات، مما يجلب الابتكار إلى مجالات مثل الواقع المعزز والقيادة الذاتية. سيشرح محرر Downcodes بالتفصيل الوظائف القوية لـ Depth Pro والمبادئ التقنية الكامنة وراءه.
مؤخرًا، أصدر فريق أبحاث الذكاء الاصطناعي التابع لشركة Apple نموذجًا جديدًا يسمى Depth Pro، وهو إنجاز كبير في مجال تقدير العمق. يمكن لهذا النموذج إنشاء خرائط عمق ثلاثية الأبعاد عالية الدقة بسرعة من صورة واحدة ثنائية الأبعاد، والمثير للدهشة أنه لا يفعل ذلك تتطلب أي بيانات تعريفية للكاميرا، وهو أمر نادر في التقنيات السابقة.

يعمل Depth Pro بسرعة كبيرة، حيث يقوم بإنشاء خرائط عميقة خلال 0.3 ثانية فقط . يمكن للنموذج إنشاء خرائط بدقة 2.25 ميجابكسل بوضوح ممتاز، والتقاط حتى التفاصيل الصغيرة مثل الشعر والنباتات التي غالبًا ما تفوتها الطرق الأخرى. وهذا يعني أنه يمكنك الحصول على مشاهد ثلاثية الأبعاد مفصلة في الوقت الفعلي، وهو أمر مفيد للعديد من الصناعات.
على سبيل المثال، في تطبيقات الواقع المعزز (AR)، يمكن دمج الكائنات الافتراضية بشكل أكثر دقة مع البيئة الحقيقية لتحسين تجربة المستخدم. وفي تكنولوجيا القيادة الذاتية، يمكن للمركبات أيضًا إدراك البيئة المحيطة بشكل أكثر دقة وتحسين سلامة القيادة.

خلف هذه التقنية توجد بنية محولات بصرية فعالة متعددة المقاييس. وقال الباحثون إن هذه البنية يمكنها معالجة المعلومات الإجمالية وتفاصيل الصورة في نفس الوقت، مما يجعل Depth Pro يتحسن بشكل كبير من حيث الدقة والسرعة. بالمقارنة مع الموديلات الأخرى، فإن أداء Depth Pro جيد بشكل خاص في التقاط التفاصيل الدقيقة، وإظهار شعر الحيوانات والأنسجة النباتية بوضوح، مما يوفر تأثيرات بصرية ممتازة.
ما هو أكثر جدير بالذكر هو أن Depth Pro يمكن أن يوفر تقديرات "للعمق المطلق"، مما يعني أنه لا يخبرك بالمواقع النسبية للأشياء فحسب، بل يخبرك أيضًا بالمسافات الفعلية.
يعد هذا أمرًا مهمًا للعديد من سيناريوهات التطبيقات، خاصة في تجارب الواقع الافتراضي التي تتطلب دقة عالية. بالإضافة إلى ذلك، يعتمد Depth Pro نهج "التعلم الصفري"، مما يعني أنه يمكنه إجراء تنبؤات دقيقة للعمق دون مجموعة بيانات محددة، وهو أمر قابل للتكيف للغاية، مما يسمح باستخدامه على نطاق واسع في مجموعة متنوعة من تطبيقات الصور.

من أجل السماح لمزيد من الناس بتجربة سحر هذه التكنولوجيا، قررت شركة Apple فتح المصدر Depth Pro. أصدر فريق البحث الكود والأوزان ذات الصلة للنماذج المدربة مسبقًا على GitHub لتشجيع المطورين والباحثين على الاستكشاف والابتكار. سيؤدي هذا بلا شك إلى تعزيز التطبيق السريع لـ Depth Pro وتطويره في مجالات متعددة مثل الروبوتات والرعاية الطبية.
مع إطلاق Pro، أظهرت Apple مرة أخرى قوتها في الابتكار التكنولوجي في مجال الذكاء الاصطناعي. لا يعمل هذا النموذج الجديد على تحسين قدرة الآلات على إدراك بيئتها فحسب، بل من المتوقع أيضًا أن يؤدي إلى تغييرات في صناعات متعددة.
مدخل المشروع: https://github.com/apple/ml- Deep-pro
تسليط الضوء على:
** تقدير العمق الفعال **: يستطيع Depth Pro إنشاء خرائط عمق ثلاثية الأبعاد عالية الدقة في 0.3 ثانية، وهو أمر سريع للغاية.
**قدرة العمق المطلقة**: لا يمكنها توفير الموقع النسبي فحسب، بل يمكنها أيضًا توفير مسافة فعلية بدقة، ومناسبة لمجموعة متنوعة من سيناريوهات التطبيق.
** مشاركة مفتوحة المصدر **: تجعل Apple Depth Pro مفتوح المصدر لتشجيع المطورين على استكشاف إمكانات تطبيقاته في مجالات مختلفة.
سيعمل المصدر المفتوح لـ Depth Pro على تعزيز تطوير تقنية تقدير العمق بشكل كبير، ومن المتوقع أن يحقق اختراقات في مجالات مثل الواقع المعزز والقيادة الذاتية. نحن نتطلع إلى قيام المزيد من المطورين بتطوير تطبيقات مبتكرة تعتمد على Depth Pro. سيستمر محرر Downcodes في الاهتمام بالتطوير اللاحق لهذا النموذج.