Исследовательская организация искусственного интеллекта объявляет рейтинг моделей изображений для генерации текста: Midjourney по-прежнему является сильнейшим королем

Автор：Eve Cole Время обновления：2025-02-26 05:00:02

Оценка производительности моделей генерации изображений искусственного интеллекта всегда была в центре внимания отрасли. Недавно компания Artificial Analysis запустила «Ранжирование и арену преобразования текста в изображение», чтобы предоставить новую платформу для объективной оценки этих моделей. Благодаря крупномасштабному сбору данных о предпочтениях человека и системе оценки ELO платформа ранжирует и сравнивает несколько ведущих моделей, включая Midjourney, DALL·E, Stable Diffusion и т. д., предоставляя ценную информацию для исследователей и пользователей.

Недавно исследовательская организация в области искусственного интеллекта Artificial Analysis запустила новую инициативу под названием «Artificial Analysis Text to Image Leaderboard & Arena», чтобы всесторонне оценить производительность этих моделей.

Обзор оценочной платформы

С момента появления генераторов изображений на основе диффузии два года назад модели изображений AI достигли качества, близкого к фотографическому. Искусственный анализ текста в изображение Leaderboard & Arena посвящен сравнению моделей генерации изображений с открытым исходным кодом и собственных моделей для определения их эффективности и точности на основе предпочтений человека.

Рейтинги платформы основаны на более чем 45 000 предпочтениях изображений людей, собранных с помощью Artificial Analysis Image Arena и обновленных с использованием системы оценки ELO. Оценка охватывает несколько ведущих моделей изображений, включая Midjourney, DALL·E от OpenAI, Stable Diffusion и Playground AI и т. д.

Метод оценки

Платформа использует краудсорсинг для сбора крупномасштабных данных о предпочтениях людей. Участникам показывали ключевое слово и два сгенерированных изображения, и они выбирали то, которое лучше всего соответствовало ключевому слову. Каждая модель генерирует более 700 изображений, охватывающих разные стили и категории, такие как портреты, группы, животные, природа и искусство. Собранные данные о предпочтениях используются для расчета оценки ELO для каждой модели, что приводит к сравнительному рейтингу.

Первоначальные идеи

Рейтинг показывает, что, хотя проприетарные модели лидируют по производительности, альтернативы с открытым исходным кодом становятся все более конкурентоспособными. Возглавили список такие модели, как Midjourney, Stable Diffusion3 и DALL·E3HD, а модель Playground AI v2.5 с открытым исходным кодом также добилась значительного прогресса, превзойдя DALL·E3 от OpenAI.

Примечательно, что ландшафт моделей генерации изображений быстро меняется. Например, DALL·E2, которая в прошлом году все еще занимала лидирующие позиции, теперь выбирается менее чем в 25% арены и опустилась до модели с самым низким рейтингом.

участие общественности

Искусственный анализ призывает общественность принять участие в этом обзоре. Пользователи могут получить доступ к спискам лидеров на Hugging Face и участвовать в процессе ранжирования через Image Arena. После выбора 30 изображений участники могут просматривать персонализированные рейтинги моделей, чтобы получить информацию, соответствующую их предпочтениям.

Этот шаг является важным шагом на пути к пониманию и совершенствованию моделей генерации изображений с помощью ИИ. Используя человеческие предпочтения и строгий краудсорсинговый подход, платформа предоставляет ценную информацию о сравнительной эффективности ведущих моделей изображений. Поскольку эта область продолжает развиваться, подобные платформы будут играть ключевую роль в руководстве будущими разработками и инновациями в области создания изображений на основе искусственного интеллекта.

Адрес ссылки на список: https://huggingface.co/spaces/ArtificialAnalysis/Text-to-Image-Leaderboard.

В целом, «Ранжирование и арена преобразования текста в изображение» от искусственного анализа представляет собой прозрачную и конкурентоспособную платформу оценки в области создания изображений с помощью ИИ, а ее постоянные обновления и участие общественности будут способствовать дальнейшему технологическому прогрессу в этой области. Мы с нетерпением ждем появления новых моделей и изменений в рейтинге в будущем.