인공 지능 분야는 주요 획기적인 발전을 이끌어 냈으며 Cohere의 비영리 연구 연구소는 최근 AYA Vision이라는 멀티 모달 AI 모델을 발표했습니다. 이 혁신적인 업적은 업계에서 광범위한 관심을 끌었으며 현재 가장 진보 된 기술 중 하나로 코셔에 의해 환영 받고 있습니다.

AYA Vision은 이미지 설명 생성, 사진 관련 질문, 텍스트 번역 및 23 개의 주요 언어로 된 추상 생성을 포함한 복잡한 작업을 처리 할 수있는 탁월한 다양성을 보여줍니다. 글로벌 과학 연구를 촉진하기 위해 Cohere는 WhatsApp 플랫폼을 통해이 기술을 무료로 제공하여 전 세계의 연구원 들이이 최첨단 성과에 쉽게 액세스하고 활용할 수 있도록합니다.

Cohere는 그의 공식 블로그에서 AI 기술의 상당한 발전에도 불구하고 다국어 처리 및 멀티 모달 작업에 여전히 중요한 격차가 있다고 강조했습니다. AYA Vision의 연구 개발은이 기술 병목 현상을 깨뜨리고 교차 언어 및 교차 모임 분야에서 인공 지능의 추가 개발을 촉진하는 것입니다.
이 모델은 AYA Vision32B와 AYA Vision8B의 두 가지 버전으로 제공됩니다. 그 중 AYA Vision32B는 여러 시각적 이해 벤치 마크에서 잘 수행되었으며 Meta의 LLAMA-3.290B 비전을 포함하여 더 큰 경쟁 모델을 능가했습니다. AYA Vision8B는 또한 일부 평가에서 크기 10 배의 모델을 잘 수행하고 성능을 발휘했습니다.

이 두 모델은 AI Development Platform Hugging Face에서 출시되었으며 Creative Commons4.0에 따라 라이센스가 부여되며 사용자는 Cohere의 허용 가능한 이용 약관의 적용을받으며 비상업적 사용으로 제한됩니다.
교육 방법 측면에서 Cohere는 번역 및 합성 주석 기술을 통해 모델을 훈련시키기 위해 혁신적인 "다각화 된"영어 데이터 세트를 채택합니다. 이 합성 주석 기술은 AI에 의해 생성됩니다. 특정 제한 사항이 있지만 OpenAI를 포함한 많은 주요 기관에서 채택하여 모델 성능 향상의 잠재력을 보여주었습니다.
Cohere는 합성 주석 기술의 사용은 훈련 효율성을 향상시킬뿐만 아니라 기술 혁신 및 자원 최적화에서 회사의 이중 장점을 반영하여 자원 소비를 크게 줄이고 있다고 말했다.
보다 심층적 인 연구를 지원하기 위해 Cohere는 새로운 벤치 마크 평가 도구 인 AyavisionBench도 출시했습니다. 이 도구는 이미지 차이 인식 및 스크린 샷-코드 복잡한 기능과 같은 시각적 및 언어 동반 작업에서 모델의 성능을 평가하도록 설계되었습니다.
인공 지능 산업의 현재 "평가 위기"를 배경으로 AyavisionBench의 출시는 모델 평가를위한보다 포괄적이고 도전적인 프레임 워크를 제공하며, 이는 산업 평가 표준의 혁신을 촉진 할 것으로 예상됩니다.
공식 블로그 : https://cohere.com/blog/aya-vision