이미지 인식 분야에서 인공 지능 간의 경쟁은 점점 더 치열 해지고 있으며 전통적인 분류 작업은 더 이상 요구를 충족시킬 수 없습니다. 특정 연도와 모델의 스포츠카를 식별하거나 새 깃털의 미묘한 차이를 구별하는 등보다 복잡한 식별 작업이 주류입니다. 이러한 작업에는 고정밀 인식 기능이 필요할뿐만 아니라 현재 신경망이 직면 한 도전 인 인식의 기초를 설명해야합니다.
신경망은 인식 작업에서 잘 수행되지만 의사 결정 과정을 설명 해달라고 요청했을 때 종종 부도덕 한 것처럼 보입니다. 전통적인 클래스 활성화 맵 (CAM) 메소드는 신경망에 대한 주요 관심 영역을 지적 할 수 있지만,이 영역이주의를 기울이는 이유를 자세히 설명 할 수는 없습니다. 특히 매우 유사한 물체에 직면 할 때 신경망은 종종 모호한 답변을 줄 수 있으며 뉘앙스를 정확하게 구별 할 수 없습니다.

이 도전을 해결하기 위해 오하이오 주립 대학 연구팀은 Finer-Cam이라는 새로운 기술을 개발했습니다. Finer-CAM은 대상 범주와 유사한 범주 간의 기능 차이를 비교하여 독특하고 독특한 기능을보다 정확하게 식별 할 수 있습니다. 이 접근법은 인식의 정확성을 향상시킬뿐만 아니라 신경망의 해석 가능성을 향상시킵니다.
미세한 캠의 핵심 아이디어는 "대비 학습"을 통해 인식 능력을 향상시키는 것입니다. 기존의 단일 범주 식별과 달리 Finer-CAM은 대상 범주를 비슷한 범주와 비교하여 이들 사이의 차이점을 찾습니다. 이 방법은 비교 분석을 통해 "모든 사람이 오류를 찾는 것"게임과 유사합니다.

더 미세한 캠의 장점은 인식 정확도뿐만 아니라 배경 간섭을 효과적으로 제거하고 대상의 주요 특징에 초점을 맞출 수있는 능력에도 반영됩니다. 전통적인 캠 방법은 종종 배경 노이즈의 영향을 받기 때문에 인식 결과가 충분하지 않습니다. 비교 분석을 통해 Finer-CAM은 관련없는 배경 정보를 필터링하여 식별 결과를 더 깨끗하고 정확하게 만들 수 있습니다.
또한 Finer-CAM은 멀티 모달 학습에서도 잘 수행됩니다. 이미지 데이터를 처리 할 수있을뿐만 아니라 텍스트 설명과 함께 식별 할 수 있습니다. 이 기능은 복잡한 작업을 처리 할 때 더 미세한 캠을보다 유연하게 만들고 다양한 입력 유형을 기반으로 정확한 식별 결과를 제공 할 수 있습니다.
미세한 캠의 출현은 이미지 인식 기술의 새로운 단계를 나타냅니다. 인식의 정확성을 향상시킬뿐만 아니라 신경망의 해석 가능성을 향상시켜 AI가 복잡한 작업에 직면 할 때 더 정확하게 답변을 제공 할 수 있습니다.
프로젝트 : https://github.com/imageomics/finer-cam
데모 : https : //colab.research.google.com/drive/1pllrl7vszvd5r71rgx3yoexebmitkt90