Поле инструментов ИИ снова вызвало переполох! Google AI Studio выпустила крупное обновление сегодня, и его последние функции быстро вызвали горячие дискуссии на платформе X. Пользователи были поражены тем, что Google AI Studio теперь может напрямую обрабатывать видео ссылки на YouTube и сразу же понять видеоконтент без загрузки или загрузки! Что еще более шокирует, так это то, что экспериментальная модель Gemini2.0flash (Gemini2.0flash Exp для короткометражных) тихо разблокирует магические навыки, генерируемые естественными изображениями, и даже может поддерживать согласованность символов на нескольких изображениях! Это обновление «официального личного результата» рассматривается как «удар по сокращению размерности» инсайдерами отрасли, что указывает на то, что многие гаджеты ИИ, которые полагаются на «заинтересованную в оболочке технологию», могут столкнуться с «Судным светом».
X Platform User Interjc опубликовал сегодня: «Google AI Studio теперь может напрямую вставить ссылки на YouTube для понимания видеоконтента, а партия различных гаджетов« оболочки »собирается упасть». Он резко указал, что эта новая функция - просто «ударом по сокращению размерности». Пользователям больше не нужно загружать видео и загружать их. Они могут задать вопросы или суммировать, просто бросив ссылку, и эффективность была улучшена более чем на один заказ. Что еще более удивительно, так это то, что даже эти «твердые кости»-без подзаголовок, не позволяют легко получить с помощью gemini2.0flash exp, а быстрое анализ контента-это просто «волшебное оружие». Пользователь Jesselaunz также лично проверил китайское видео без субтитра. В результате, Gemini2.0flash Exp «идеально суммировал» видеоконтент, и эффект был далеко за пределами других крупных моделей. Его можно назвать «эксклюзивным навыком», делая другие ИИ за пределами досягаемости.
Если понимание видео-это просто «закуска», то эволюция Gemini2.0flash Exp в генерации изображений можно назвать «бомбой на уровне ядерной бомбы». X Пользователь Dotey поделился шокирующей записи экрана на платформе. Она использовала ключевое слово «черепаха и зайца для гонки» в качестве ключевых слов и сгенерировали 8 сцена сцена за один раз, и результаты были потрясающими! Сгенерированные картинки не только натуральные и гладкие, но и более удивительно, так это то, что персонажи «черепаха» и «кролик» на картинке фактически сохраняют весьма последовательный вид на 8 картинках! Что еще более удивительно, так это то, что на первой картине даже есть четыре больших персонажа на китайском: «Черепаха и заяц». Хотя удары слегка ошибочны, когда тщательно наблюдают, эта способность все еще удивительна. Доти взволнованно вздохнул: «Эта скорость слишком быстрая, это просто удар различных инструментов« Shell Set »!»
Обсуждение на платформе X продолжает расти. Мощная сила, показанная Gemini2.0flash Exp, отражается не только в его мультимодальной обработке, но также в удивительной скорости поколения и необычайной стабильности. Пользователь Python_XXT проверил видео ссылку без субтитрам более одного часа. Gemini2.0flash Exp может на самом деле «напрямую выводить конференц-конференцию и углубленный анализ, а эффект идеально подходит для всех сводных инструментов на рынке», что является просто «магией». Реализация этой функции, несомненно, связана с глубоким пониманием видеоконтента Gemini2.0flash Exp. Даже без «благословения» субтитров он может точно извлечь ключевую информацию в видео, что показывает ее техническую силу.
Инсайдеры промышленности активно запечатлели, что обновление Google AI Studio отмечает серьезную преобразование его стратегии разработки - ускорение эволюции в инструменты на уровне приложений с простой платформы базовой модели. X Пользователь Gantrols ослабляет, что функция генерации изображений Gemini2.0flash Exp может идеально поддерживать китайские подсказки и модификации диалога, что, несомненно, значительно уменьшает порог пользователя для использования. Он также вдумчиво прикрепил Руководство по операциям: «Просто зайдите в AI Studio и выберите модели», и линии показывают высокое значение Google для дружелюбия разработчика.
Конечно, новые функции являются захватывающими, но некоторые пользователи указали на свои оставшиеся «недостатки». Например, Dothy заметил, что в китайском тексте, создаваемых Gemini2.0flash Exp, все еще есть некоторые незначительные проблемы с инсультом. Пользователь Lessnoise365 также упомянул, что аналогичные функции фактически встроены в Близнецы пиксельных телефонов. Хотя свободные преимущества AI Studio являются выдающимися, может быть место для дальнейшей оптимизации с точки зрения простоты использования. Однако недостатки не скрывают достоинств. Пользователи на платформе X в целом считают, что это обновление окажет глубокое влияние на существующую экосистему инструмента искусственного интеллекта, особенно те «оболочки», которые полагаются на простую упаковку, которые, несомненно, сталкиваются с огромными проблемами выживания.
Google официально не выпустил комплексные технические детали Gemini2.0flash Exp, но его удивительные мультимодальные возможности и эффективность вызвали сильные ожидания со всей отрасли. Благодаря непрерывной итерации и модернизации AI Studio, будет ли Google еще больше интегрировать свои огромные экологические ресурсы и запустить более разрушительные функции искусственного интеллекта, может стать наиболее важным основным моментом в области искусственного интеллекта в 2025 году.
Адрес API:
https://ai.google.dev/gemini-api/docs/vision?lang=python&hl=zh-cn#youtube