การแข่งขันระหว่างปัญญาประดิษฐ์ในสาขาการจดจำภาพกำลังรุนแรงขึ้นเรื่อย ๆ และงานการจำแนกแบบดั้งเดิมไม่สามารถตอบสนองความต้องการได้อีกต่อไป งานประจำตัวที่ซับซ้อนมากขึ้นตอนนี้เป็นกระแสหลักเช่นการระบุรถสปอร์ตของปีและรุ่นเฉพาะหรือแยกแยะความแตกต่างเล็กน้อยในขนนก งานเหล่านี้ไม่เพียง แต่ต้องการความสามารถในการรับรู้ที่มีความแม่นยำสูง แต่ยังต้องอธิบายพื้นฐานสำหรับการรับรู้ซึ่งเป็นความท้าทายที่ต้องเผชิญกับเครือข่ายประสาทปัจจุบัน
แม้ว่าเครือข่ายประสาททำงานได้ดีในงานที่ได้รับการยอมรับ แต่พวกเขามักจะไร้ยางอายเมื่อถูกขอให้อธิบายกระบวนการตัดสินใจของพวกเขา แม้ว่าวิธีการเปิดใช้งานคลาสแบบดั้งเดิม (CAM) สามารถชี้ให้เห็นถึงประเด็นสำคัญที่ให้ความสนใจกับเครือข่ายประสาท แต่ก็ไม่สามารถอธิบายรายละเอียดเกี่ยวกับ "ทำไม" พื้นที่เหล่านี้กำลังถูกติดตาม โดยเฉพาะอย่างยิ่งเมื่อเผชิญกับวัตถุที่คล้ายกันมากเครือข่ายประสาทมักจะให้คำตอบที่คลุมเครือและไม่สามารถแยกแยะความแตกต่างได้อย่างถูกต้อง

เพื่อจัดการกับความท้าทายนี้ทีมวิจัยมหาวิทยาลัยแห่งรัฐโอไฮโอได้พัฒนาเทคโนโลยีใหม่ที่เรียกว่า Finer-Cam Finer-CAM สามารถระบุคุณสมบัติที่ไม่ซ้ำกันและโดดเด่นได้อย่างแม่นยำมากขึ้นโดยการเปรียบเทียบความแตกต่างของคุณสมบัติระหว่างหมวดหมู่เป้าหมายและหมวดหมู่ที่คล้ายกัน วิธีการนี้ไม่เพียง แต่ช่วยเพิ่มความแม่นยำในการรับรู้ แต่ยังช่วยเพิ่มความสามารถในการตีความของเครือข่ายประสาท
แนวคิดหลักของ CAM ที่ดีขึ้นคือการเพิ่มความสามารถในการรับรู้ผ่าน "การเรียนรู้ความคมชัด" ซึ่งแตกต่างจากการระบุหมวดหมู่เดียวแบบดั้งเดิม Finer-CAM เปรียบเทียบหมวดหมู่เป้าหมายกับหมวดหมู่ที่คล้ายกันเพื่อค้นหาความแตกต่างระหว่างพวกเขา วิธีนี้คล้ายกับเกม "ทุกคนมาพบกับความผิด"

ข้อดีของ CAM ที่ละเอียดกว่านั้นไม่เพียง แต่สะท้อนให้เห็นถึงความแม่นยำในการรับรู้เท่านั้น แต่ยังรวมถึงความสามารถในการลบสัญญาณรบกวนพื้นหลังอย่างมีประสิทธิภาพและมุ่งเน้นไปที่คุณสมบัติที่สำคัญของเป้าหมาย วิธี CAM แบบดั้งเดิมมักได้รับผลกระทบจากเสียงรบกวนจากพื้นหลังส่งผลให้เกิดผลการจดจำไม่เพียงพอ ผ่านการวิเคราะห์เปรียบเทียบ CAM ที่ดีขึ้นสามารถกรองข้อมูลพื้นหลังที่ไม่เกี่ยวข้องทำให้ผลลัพธ์การระบุตัวตนสะอาดขึ้นและแม่นยำยิ่งขึ้น
นอกจากนี้ CAM ที่ละเอียดยิ่งขึ้นยังทำงานได้ดีในการเรียนรู้หลายรูปแบบ ไม่เพียง แต่สามารถประมวลผลข้อมูลภาพ แต่ยังระบุร่วมกับคำอธิบายข้อความ ความสามารถนี้ทำให้ CAM มีความยืดหยุ่นมากขึ้นเมื่อจัดการงานที่ซับซ้อนและสามารถให้ผลลัพธ์การระบุที่ถูกต้องตามประเภทอินพุตที่แตกต่างกัน
การเกิดขึ้นของ CAM ที่ละเอียดยิ่งขึ้นเป็นขั้นตอนใหม่ในเทคโนโลยีการจดจำภาพ ไม่เพียง แต่ช่วยเพิ่มความแม่นยำในการรับรู้ แต่ยังช่วยเพิ่มความสามารถในการตีความของเครือข่ายประสาททำให้ AI ให้คำตอบที่ถูกต้องได้อย่างมั่นใจมากขึ้นเมื่อเผชิญกับงานที่ซับซ้อน
โครงการ: https://github.com/imageomics/finer-cam
ตัวอย่าง: https: //colab.research.google.com/drive/1pllrl7vszvd5r71rgx3yoexebmitkt90