ทีมนักวิจัยจากมหาวิทยาลัย Surrey และมหาวิทยาลัย Stanford ในสหราชอาณาจักรประสบความสำเร็จในการพัฒนาด้านปัญญาประดิษฐ์: พวกเขาได้พัฒนาวิธีการใหม่ที่ช่วยให้ปัญญาประดิษฐ์สามารถเข้าใจภาพร่างการวาดเส้นที่วาดโดยมนุษย์ แม้ว่าภาพร่างเหล่านี้จะ ทำโดยผู้ที่ไม่ใช่ผู้เชี่ยวชาญของ ผลการวิจัยนี้ช่วยให้ปัญญาประดิษฐ์สามารถบรรลุความแม่นยำที่ใกล้เคียงมนุษย์ในการระบุภาพร่างของฉาก วางรากฐานสำหรับการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ที่ทรงพลังยิ่งขึ้น และขั้นตอนการออกแบบที่มีประสิทธิภาพมากขึ้น ความก้าวหน้าทางเทคโนโลยีนี้ไม่เพียงสะท้อนให้เห็นในการจดจำวัตถุในภาพร่างเท่านั้น แต่ที่สำคัญกว่านั้นคือความสามารถในการเข้าใจความหมายของแต่ละจังหวะในภาพร่าง ซึ่งให้แนวคิดใหม่สำหรับปัญญาประดิษฐ์ในการทำความเข้าใจการแสดงออกทางสายตาของมนุษย์
ทีมนักวิจัยจากมหาวิทยาลัย Surrey และมหาวิทยาลัย Stanford ในสหราชอาณาจักรได้พัฒนาวิธีการใหม่ในการสอนปัญญาประดิษฐ์ (AI) เพื่อทำความเข้าใจภาพร่างการวาดเส้นของมนุษย์ แม้ว่าจะถูกวาดโดยผู้ที่ไม่ใช่ศิลปินก็ตาม แบบจำลองใช้ประสิทธิภาพระดับมนุษย์ในการจดจำภาพร่างของฉาก

ดร. Yulia Gryaditskaya อาจารย์จากศูนย์การมองเห็น คำพูด และสัญญาณ (CVSSP) แห่งมหาวิทยาลัย Surrey และสถาบันปัญญาประดิษฐ์กลาง (PAI) แห่งมหาวิทยาลัย Surrey กล่าวว่า "การร่างภาพเป็นภาษาสื่อสารด้วยภาพที่ทรงพลัง บางครั้งมันก็มีพลังมากกว่านั้นด้วยซ้ำ" ภาษาพูดที่แสดงออกและยืดหยุ่นการพัฒนาเครื่องมือเพื่อทำความเข้าใจภาพร่างเป็นก้าวหนึ่งสู่การโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ที่ทรงพลังยิ่งขึ้นและขั้นตอนการออกแบบที่มีประสิทธิภาพยิ่งขึ้น” ผู้คนใช้การวาดภาพเพื่อสำรวจแนวคิดใหม่ๆ และสื่อสารโดยไม่คำนึงถึงอายุและภูมิหลัง อย่างไรก็ตาม ระบบ AI มักจะมีปัญหาในการทำความเข้าใจภาพร่างอยู่เสมอ AI ต้องเรียนรู้ที่จะเข้าใจภาพ โดยทั่วไปแล้ว ขั้นตอนนี้ต้องใช้เวลาและลำบากในการรวบรวมป้ายกำกับสำหรับทุกพิกเซลในภาพ จากนั้น AI ก็เรียนรู้จากป้ายกำกับเหล่านี้
อย่างไรก็ตาม ทีมวิจัยได้สอน AI ผ่านการผสมผสานระหว่างภาพร่างและคำอธิบายที่เป็นลายลักษณ์อักษร เรียนรู้ที่จะจัดกลุ่มพิกเซล โดยจับคู่กับหมวดหมู่ในคำอธิบาย เป็นผลให้ AI แสดงให้เห็นถึงความเข้าใจของมนุษย์ที่สมบูรณ์และใกล้ชิดยิ่งขึ้นกว่าที่เคย สามารถระบุและติดแท็กว่าว ต้นไม้ ยีราฟ และวัตถุอื่นๆ ได้อย่างถูกต้องด้วยความแม่นยำ 85% ซึ่งมีประสิทธิภาพเหนือกว่ารุ่นอื่นๆ ที่ใช้พิกเซลที่ติดแท็ก นอกเหนือจากการระบุวัตถุในฉากที่ซับซ้อนแล้ว ยังสามารถกำหนดได้ว่าแต่ละจังหวะจะใช้เพื่อแสดงวัตถุใด วิธีการใหม่นี้ใช้ได้ผลไม่เพียงแต่กับภาพร่างที่ไม่เป็นทางการซึ่งจัดทำโดยผู้ที่ไม่ใช่ศิลปินเท่านั้น แต่ยังใช้กับภาพร่างที่จัดทำโดยผู้ถูกทดสอบโดยไม่ได้รับการฝึกอบรมอย่างชัดเจนอีกด้วย
จูดิธ ฟาน ผู้ช่วยศาสตราจารย์ด้านจิตวิทยาที่มหาวิทยาลัยสแตนฟอร์ด กล่าวว่า "การวาดภาพและการเขียนเป็นกิจกรรมที่สำคัญที่สุดของมนุษย์ และมีการใช้กันมานานแล้วในการจับภาพการสังเกตและความคิดของผู้คน งานนี้เป็นก้าวสำคัญในความสามารถของระบบ AI ในการทำความเข้าใจ ธรรมชาติของความคิดที่ผู้คนพยายามจะสื่อ มีความก้าวหน้าที่น่าตื่นเต้น ไม่ว่าพวกเขาจะใช้รูปภาพหรือข้อความก็ตาม” การวิจัยนี้ดำเนินการโดยเป็นส่วนหนึ่งของศูนย์ปัญญาประดิษฐ์ของมหาวิทยาลัย Surrey โดยเฉพาะโครงการริเริ่ม SketchX SketchX ใช้ปัญญาประดิษฐ์เพื่อพยายามทำความเข้าใจวิธีที่เรามองโลกผ่านวิธีที่เราวาด
ศาสตราจารย์ซ่ง ยี่เจ๋อ ผู้อำนวยการร่วมของสถาบันปัญญาประดิษฐ์แห่งศูนย์ประชาชนและหัวหน้าของ SketchX กล่าวว่า "งานวิจัยนี้เป็นตัวอย่างที่สำคัญของการที่ AI สามารถปรับปรุงกิจกรรมพื้นฐานของมนุษย์ เช่น การสเก็ตช์ภาพ โดยการทำความเข้าใจภาพร่างคร่าวๆ ที่ใกล้เคียง- ความแม่นยำของมนุษย์ เทคโนโลยีนี้มีศักยภาพมหาศาลในการเพิ่มความคิดสร้างสรรค์ตามธรรมชาติของผู้คน โดยไม่คำนึงถึงความสามารถทางศิลปะ”
ที่อยู่กระดาษ: https://arxiv.org/abs/2312.12463
ผลการวิจัยนี้ได้ก่อให้เกิดความก้าวหน้าครั้งใหม่ในด้านปัญญาประดิษฐ์ในด้านการทำความเข้าใจภาพและการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ คาดว่าจะมีการใช้กันอย่างแพร่หลายในด้านการออกแบบ การสร้างสรรค์ทางศิลปะ และสาขาอื่นๆ ในอนาคต ซึ่งจะช่วยส่งเสริมการพัฒนาร่วมกันระหว่างมนุษย์และปัญญาประดิษฐ์ ปัญญา. ความก้าวหน้าในเทคโนโลยีนี้ยังแสดงให้เห็นถึงศักยภาพมหาศาลของปัญญาประดิษฐ์ในการทำความเข้าใจข้อมูลที่ไม่มีโครงสร้างของมนุษย์