واجهت تقنية تحديد المواقع المرئية منظمة العفو الدولية دائمًا اختناقات دقة. طور الباحثون في إلينوي للتكنولوجيا ومعهد أبحاث سيسكو وجامعة وسط فلوريدا إطار SEGVG لحل هذه المشكلة وإعطاء "رؤية عالية الدقة". جوهر SEGVG هو معالجة التفاصيل على مستوى البكسل ، وتحويل معلومات الصندوق المحيط إلى إشارات تجزئة ، تمامًا مثل ارتداء "نظارات عالية الدقة" للذكاء الاصطناعي ، مما يسمح لها بتحديد كل بكسل بوضوح.
في مجال رؤية الذكاء الاصطناعى ، كان تحديد المواقع المستهدف دائمًا مشكلة صعبة. الخوارزميات التقليدية مثل "قصر النظر" ، والتي يمكن أن تدور حول الهدف تقريبًا بـ "إطارات" ، ولكن لا يمكنها رؤية التفاصيل في الداخل. يبدو الأمر كما لو كنت تصف شخصًا لصديقًا وتحدث فقط عن ارتفاعه التقريبي وشكل الجسم.
من أجل حل هذه المشكلة ، قامت مجموعة من BigWigs من جامعة إلينوي للتكنولوجيا ومعهد Cisco للأبحاث وجامعة سنترال فلوريدا بتطوير إطار عمل مرئي جديد يسمى SEGVG ، مدعيا أنه السماح لـ AI Bidewell بـ "قصر النظر" من الآن فصاعدًا!
السر الأساسي لـ SEGVG هو: "على مستوى البكسل"! يقوم SEGVG بتحويل معلومات الصندوق المحيط إلى إشارات تجزئة ، وهو ما يعادل وضع "نظارات عالية الدقة" على الذكاء الاصطناعي ، مما يسمح لـ AI برؤية كل بكسل من الهدف بوضوح!

على وجه التحديد ، تتبنى SEGVG "ترميز متعدد الطبقات متعدد الطبقات". يبدو الاسم معقدًا ، ولكن يمكنك في الواقع فهمه باعتباره "مجهر" فائق الدقة يحتوي على استعلامات للانحدار والاستعلامات المتعددة للتجزئة. ببساطة ، هو استخدام "العدسات" المختلفة لأداء مهام الانحدار والتجزئة مربعات ، ومراقبة بشكل متكرر الهدف ، واستخراج معلومات أكثر دقة.
الأمر الأكثر إثارة للدهشة هو أن SEGVG قدمت أيضًا "وحدة محاذاة تيرنية" ، وهي مكافئة لتجهيز الذكاء الاصطناعي مع "مترجم" لحل مشكلة "انسداد اللغة" على وجه التحديد بين معلمات التدريب النموذجية وتضمين الاستعلام. من خلال آلية الانتباه الثلاثي ، يمكن لهذا "المترجم" "ترجمة" الاستعلام والنص والميزات المرئية إلى نفس القناة ، مما يسمح لـ AI بفهم المعلومات المستهدفة بشكل أفضل.

ما هو تأثير SEGVG؟ حقق نتائج اختراق!
بالإضافة إلى تحديد المواقع الدقيقة ، يمكن لـ SEGVG أيضًا إخراج درجة الثقة التي تنبأ بها النموذج. ببساطة ، سوف يخبرك منظمة العفو الدولية بمدى ثقةها في الحكم على نفسها. هذا مهم للغاية في التطبيقات العملية.
يعد المصدر المفتوح لـ SEGVG فائدة كبيرة لمجال AI Coneser بأكمله!
عنوان الورق: https://arxiv.org/pdf/2407.03200
رابط الرمز: https://github.com/weitaikang/segvg/tree/main
يمثل ظهور SEGVG تقدمًا كبيرًا في تقنية تحديد المواقع المرئية منظمة العفو الدولية.