حقق فريق من الباحثين من جامعة ساري وجامعة ستانفورد في المملكة المتحدة طفرة في مجال الذكاء الاصطناعي: فقد طوروا طريقة جديدة تمكن الذكاء الاصطناعي من فهم الرسومات التخطيطية التي يرسمها البشر، حتى لو كانت هذه الرسومات مصنوعة من قبل غير الخبراء. تتيح نتيجة البحث هذه للذكاء الاصطناعي تحقيق دقة قريبة من المستوى البشري في تحديد رسومات المشهد، ووضع الأساس لتفاعل أكثر قوة بين الإنسان والحاسوب وسير عمل تصميم أكثر كفاءة. ولا ينعكس هذا الطفرة التكنولوجية في التعرف على الأشياء الموجودة في الرسم فحسب، بل الأهم من ذلك، القدرة على فهم معنى كل ضربة في الرسم، مما يوفر أفكارًا جديدة للذكاء الاصطناعي لفهم التعبير البصري البشري.
طور فريق من الباحثين من جامعة سري وجامعة ستانفورد في المملكة المتحدة طريقة جديدة لتعليم الذكاء الاصطناعي (AI) فهم رسومات رسم الخطوط البشرية، حتى عندما يرسمها غير الفنانين. يحقق النموذج أداءً قريبًا من المستوى البشري في التعرف على رسومات المشهد.

وقالت الدكتورة يوليا جرياديتسكايا، المحاضرة في مركز الرؤية والكلام ومعالجة الإشارات بجامعة ساري (CVSSP) ومعهد الذكاء الاصطناعي المركزي التابع لشعب ساري (PAI): "إن الرسم هو لغة اتصال بصرية قوية، وفي بعض الأحيان يكون أقوى من لغة التواصل المرئي الأخرى". اللغة المنطوقة معبرة ومرنة. يعد تطوير الأدوات لفهم الرسومات التخطيطية خطوة نحو تفاعل أكثر قوة بين الإنسان والحاسوب وسير عمل تصميم أكثر كفاءة. بغض النظر عن العمر والخلفية، يستخدم الأشخاص الرسم لاستكشاف أفكار جديدة والتواصل. ومع ذلك، واجهت أنظمة الذكاء الاصطناعي دائمًا مشاكل في فهم الرسومات التخطيطية. يجب أن يتعلم الذكاء الاصطناعي فهم الصور. عادةً ما يتطلب ذلك عملية تستغرق وقتًا طويلاً وشاقة لجمع التسميات لكل بكسل في الصورة. ثم يتعلم الذكاء الاصطناعي من هذه التسميات.
ومع ذلك، قام فريق البحث بتعليم الذكاء الاصطناعي من خلال مجموعة من الرسومات والأوصاف المكتوبة. لقد تعلمت تجميع وحدات البكسل ومطابقتها للفئات في الوصف. ونتيجة لذلك، يُظهِر الذكاء الاصطناعي فهماً إنسانياً أكثر ثراءً وأقرب من أي وقت مضى. وكان قادرًا على تحديد الطائرات الورقية والأشجار والزرافات والأشياء الأخرى ووضع علامات عليها بشكل صحيح بدقة تصل إلى 85%، متفوقًا على النماذج الأخرى التي تعتمد على وحدات البكسل الموسومة. بالإضافة إلى تحديد الكائنات في المشاهد المعقدة، يمكنها أيضًا تحديد الكائن الذي سيتم استخدام كل ضربة لتصويره. لا تعمل هذه الطريقة الجديدة فقط مع الرسومات غير الرسمية التي يرسمها غير الفنانين، ولكن أيضًا مع الرسومات التي يرسمها أشخاص دون تدريب واضح.
وقالت جوديث فان، الأستاذ المساعد في علم النفس بجامعة ستانفورد: "يعد الرسم والكتابة من أهم الأنشطة البشرية وقد استخدما منذ فترة طويلة لالتقاط ملاحظات الناس وأفكارهم. ويعد هذا العمل خطوة مهمة إلى الأمام في قدرة أنظمة الذكاء الاصطناعي على الفهم". لقد تم إحراز تقدم مثير في طبيعة الأفكار التي يحاول الناس نقلها، سواء كانوا يستخدمون الصور أو النصوص. يستخدم SketchX الذكاء الاصطناعي لمحاولة فهم الطريقة التي نرى بها العالم من خلال الطريقة التي نرسم بها.
وقال البروفيسور سونج ييزهي، المدير المشارك لمعهد الذكاء الاصطناعي في مركز الشعب ورئيس SketchX: "يعد هذا البحث مثالًا رئيسيًا على كيفية تعزيز الذكاء الاصطناعي للأنشطة البشرية الأساسية مثل الرسم. من خلال فهم الرسومات التقريبية مع ما يقرب من- الدقة البشرية، فإن هذه التكنولوجيا لديها إمكانات هائلة لتعزيز الإبداع الطبيعي لدى الناس، بغض النظر عن المواهب الفنية.
عنوان الورقة: https://arxiv.org/abs/2312.12463
وقد أحدثت نتيجة البحث هذه اختراقات جديدة في الذكاء الاصطناعي في مجالات فهم الصور والتفاعل بين الإنسان والحاسوب، ومن المتوقع أن يتم استخدامه على نطاق واسع في التصميم والإبداع الفني وغيرها من المجالات في المستقبل، مما يزيد من تعزيز التنمية التعاونية بين البشر والصناعات الاصطناعية. ذكاء. يُظهر التقدم في هذه التكنولوجيا أيضًا الإمكانات الهائلة للذكاء الاصطناعي في فهم المعلومات البشرية غير المنظمة.