AIツールのフィールドが再び騒ぎを引き起こしました! Google AI Studioは本日、メジャーアップデートをリリースしました。その最新の機能により、Xプラットフォームでの加熱された議論がすぐに巻き込まれました。ユーザーは、Google AI StudioがYouTubeビデオリンクを直接処理できるようになり、ダウンロードやアップロードせずにビデオコンテンツをすぐに理解できるようになりました。さらに衝撃的なのは、Gemini2.0Flashの実験モデル(Gemini2.0FlashExp for Shortの場合)が自然な画像によって生成された魔法のスキルを静かにロック解除し、複数の画像のキャラクターの一貫性を維持することさえできることです。 「公式の個人的結果」のこの更新は、業界のインサイダーによる「次元削減ストライク」と見なされており、「シェル閉鎖された」技術に依存する多くのAIガジェットが「終末」に直面する可能性があることを示しています。
XプラットフォームユーザーInterJCは本日投稿しました:「Google AI StudioはYouTubeリンクを直接貼り付けてビデオコンテンツを理解できるようになり、さまざまな「シェル」ガジェットのバッチが倒れそうです。」彼は、この新しい機能は単に「次元減少ブロー」であると鋭く指摘しました。ユーザーはビデオをダウンロードしてアップロードする必要がなくなりました。リンクを投げるだけで質問をしたり要約したりすることができ、効率は複数の桁を改善しました。さらに驚くべきことは、それらの「ハードボーン」のような字幕のないビデオでさえ、Gemini2.0Flash Expによって簡単に取得できることです。コンテンツをすばやく解析することは単に「魔法の武器」です。ユーザーJesselaunzは、字幕なしで中国のビデオを個人的にテストしました。その結果、Gemini2.0Flash Expはビデオコンテンツを「完全に要約」し、その効果は他の大きなモデルをはるかに超えていました。これは、「排他的なスキル」と呼ばれ、手の届かないところに他のAIを作成できます。
ビデオの理解が単なる「前菜」である場合、画像生成におけるGemini2.0フラッシュExpの進化は「核爆弾レベル」の爆弾と呼ばれます。 XユーザーDoteyは、プラットフォーム上の衝撃的な画面録音を共有しました。彼女はキーワード「カメとうさぎのレース」をキーワードとして使用し、一度に8つのシーンの写真を生成しました。結果は驚くべきものでした!生成された写真は自然で滑らかであるだけでなく、さらに驚くべきことは、写真のキャラクター「カメ」と「ウサギ」が実際に8枚の写真で非常に一貫した外観を維持していることです!さらに驚くべきことは、最初の写真には中国語に4人の大きなキャラクターがいることです。「カメとヘアレース」です。慎重に観察するとストロークはわずかに欠陥がありますが、この能力はまだ驚くべきものです。 Doteyは興奮してため息をつきました:「この速度は速すぎます。さまざまな「シェルセット」ツールのヒットです!」
Xプラットフォームに関する議論は増え続けています。 Gemini2.0Flash Expによって示される強力な強さは、マルチモーダル処理機能だけでなく、驚くべき世代の速度と並外れた安定性にも反映されています。ユーザーPython_xxtは、字幕なしで1時間以上ビデオリンクをテストしました。 Gemini2.0Flash Expは、実際に「会議のコンテンツと詳細な分析を直接出力することができ、その効果は単に「魔法」である市場のすべての略式ツールに最適です」。この関数の実装は、間違いなくGemini2.0Flash Expのビデオコンテンツに関する深い理解によるものです。字幕の「祝福」がなくても、ビデオ内の重要な情報を正確に抽出できます。これは、技術的な強さを示しています。
業界のインサイダーは、Google AI Studioの更新が開発戦略の大きな変化を示していることを鋭く捉えています。つまり、シンプルな基本モデルプラットフォームからのアプリケーションレベルのツールへの進化を加速します。 XユーザーGantrolsは、Gemini2.0Flash Expの画像生成関数が中国の迅速な言葉と対話の変更を完全にサポートできることを秘密に指摘しました。彼はまた、「AI Studioに行ってモデルを選択する」というオペレーションガイドを想像して添付しました。このラインは、Googleが開発者の親しみやすさにとって非常に重要であることを明らかにしています。
もちろん、新機能はエキサイティングですが、一部のユーザーは残りの「欠陥」を指摘しています。たとえば、Doteyは、Gemini2.0Flash Expによって生成された中国のテキストにはまだいくつかの小さな脳卒中問題があることを観察しました。ユーザーレッスルズ365は、同様の機能が実際にはピクセル電話のジェミニに組み込まれていると述べました。 AIスタジオの無料の利点は傑出していますが、使いやすさの点でさらに最適化する余地があるかもしれません。ただし、欠陥はメリットを隠しません。 Xプラットフォーム上のユーザーは、一般に、このアップデートが既存のAIツールエコシステム、特に単純なパッケージに依存する「シェルカプセル化」アプリケーションに大きな影響を与えると考えています。
GoogleはGemini2.0Flash Expの包括的な技術的詳細を正式にリリースしていませんが、その驚くべきマルチモーダル機能と効率性は、業界全体から強い期待を喚起しています。 AIスタジオの継続的な反復とアップグレードにより、Googleがその巨大な生態学的リソースをさらに統合し、より破壊的なAI関数を発売するかどうかは、2025年のAIフィールドで最も重要なハイライトになる可能性があります。
APIアドレス:
https://ai.google.dev/gemini-api/docs/vision?lang=python&hl=zh-cn#youtube