Область искусственного интеллекта провела серьезный прорыв, и некоммерческая исследовательская лаборатория Cohere недавно выпустила мультимодальную модель искусственного интеллекта под названием Aya Vision. Это инновационное достижение привлекло широкое внимание в отрасли и провозглашается Cohere как одну из самых передовых технологий в настоящее время.

Aya Vision демонстрирует превосходную универсальность, способную выполнять сложные задачи, включая генерацию изображения, генерация, связанные с фотографиями, текстовый перевод и абстрактное создание на 23 основных языках. Для содействия глобальным научным исследованиям Cohere предоставляет эту технологию бесплатно через платформу WhatsApp, позволяя исследователям во всем мире легко получить доступ и использовать это передовое достижение.

В его официальном блоге Cohere подчеркивается, что, несмотря на значительные достижения в области технологий искусственного интеллекта, все еще существуют значительные пробелы в многоязычной обработке и мультимодальных задачах. Исследования и разработки Aya Vision заключаются в том, чтобы прорваться через это техническое узкое место и способствовать дальнейшему развитию искусственного интеллекта в областях межязычной и кросс-модальности.
Модель доступна в двух версиях: Aya Vision32b и Aya Vision8b. Среди них Aya Vision32b хорошо показал несколько показателей визуального понимания, даже превосходя более крупные конкурентные модели, в том числе Meta Llama-3.290b Vision. Aya Vision8B также хорошо показал, что в некоторых оценках превзошло модели в десять раз его размер.

Эти две модели были выпущены на платформе для развития искусственного интеллекта и лицензированы в соответствии с Creative Commons4.0, и пользователи подлежат приемлемым условиям использования Cohue и ограничены некоммерческим использованием.
С точки зрения методов обучения, Cohere принимает инновационный «диверсифицированный» набор данных английского языка для обучения моделей с помощью методов перевода и синтетических аннотаций. Эта технология синтетической аннотации генерируется ИИ. Несмотря на то, что он имеет определенные ограничения, он был принят многими ведущими учреждениями, в том числе OpenAI, демонстрируя его потенциал в повышении производительности модели.
Cohere сказал, что использование технологии синтетических аннотаций не только повышает эффективность обучения, но и значительно снижает потребление ресурсов, отражая двойные преимущества компании в области технологических инноваций и оптимизации ресурсов.
Чтобы поддержать более глубокие исследования, Cohere также запустил AyavisionBench, новый эталонный инструмент оценки. Инструмент предназначен для оценки производительности модели в визуальных и языковых задачах, таких как распознавание разности изображений и комплексы экрана к код.
На фоне нынешнего «кризиса оценки» в индустрии искусственного интеллекта, запуск AyavisionBench обеспечивает более полную и сложную основу для оценки моделей, которая, как ожидается, будет способствовать инновациям в стандартах оценки отрасли.
Официальный блог: https://cohere.com/blog/aya-vision