Google Deepmindは最近、最新のRobotics Technology -Gemini Roboticsをリリースしました。これは、物理的な世界で人工知能の実用的なアプリケーションの重要なステップをマークするテクノロジーです。従来のホームロボットとは異なり、Gemini Roboticsは、高度なAIテクノロジーをロボットエンティティに組み込むことを目指しており、人間の能力を超えても現実世界で複雑なタスクを実行できるようにします。
Gemini Roboticsのコアテクノロジーは、Gemini 2.0モデルに基づいており、テキスト、画像、オーディオ、ビデオの処理に強力な機能を実証しています。さらなる技術革新を通じて、Gemini Roboticsはロボットが物理的空間を理解し、運用することができます。これは、ロボットがさまざまな形式の指示を受け取って処理できるだけでなく、これらの命令を実際の物理的行動に変換することができることを意味します。
Gemini Roboticsの一般化能力は、最も人目を引く機能の1つです。プリセットプログラムのみを実行できる従来のロボットとは異なり、Gemini Roboticsは豊かな世界の知識を活用して、新しいオブジェクト、新しい命令、新しい環境に迅速に適応し、効果的なソリューションを見つけることができます。 Googleのテストデータは、Gemini Roboticsが包括的な一般化ベンチマークの他のトップの視覚言語アクションモデルをはるかに上回り、その優れた適応性と問題解決能力を示していることを示しています。

Gemini Roboticsは、人間のコンピューターの相互作用にも優れています。毎日の口語の指示を理解し、環境の指示や変化の変化に迅速に対応できます。さらに、Gemini Roboticsは、過度の手動介入なしに予備の指示を受けた後、独立してタスクを完了することができます。この高度な自律性と柔軟性により、Gemini Roboticsは、ユーザーがさまざまな毎日のタスクを完了するのに役立つ理想的なホームアシスタントです。
Gemini Roboticsの柔軟性は、その知能だけでなく、細かい動きを実行する能力にも反映されています。折り紙、昼食の梱包、絶妙なサラダを作るかどうかにかかわらず、ジェミニロボットは繊細な動きと正確な調整を示すことができます。この機能により、Gemini Roboticsは、細かい操作を必要とし、ユーザーに高品質のサービスを提供するタスクでうまく機能します。
Gemini Roboticsのマルチモルフィック適応性は、もう1つのハイライトです。ダブルアームロボットプラットフォームAloha2であろうと、ヒューマノイドロボットApptronikのApolloであろうと、Gemini Roboticsが簡単に制御できる場合でも、さまざまなロボットフォームに適応できます。この幅広い適応性は、将来的にはさまざまな分野のジェミニロボットを装備したインテリジェントロボットを見ることができ、あらゆる分野に革新的な変化をもたらすことを意味します。

Gemini Roboticsに加えて、GoogleはGemini Robotics-ERを発売しました。これは、物理世界のロボットの空間的理解の改善に重点を置くモデルです。既存の低レベルコントローラーと組み合わせることにより、Gemini Robotics-ERは、オブジェクトの識別と3D検出のGemini2.0の機能を大幅に改善し、「その場で」新しいロボット関数を作成することさえできます。この革新的なテクノロジーは、複雑な環境でロボットを適用する可能性を高めます。
AIテクノロジーの開発を促進しながら、Googleはセキュリティの問題を非常に重要にしています。 Gemini Robotics-ERは、ロボットの元のセキュリティコントローラーと対話して、潜在的なアクションの安全性を確保し、適切な応答を生成します。さらに、Googleは、具体化されたAIおよびロボットのセマンティックセキュリティを評価および改善するために、新しいデータセットAsimovをリリースしました。 Googleは、内部および外部の専門家、政策立案者、責任およびセキュリティ委員会とのコラボレーションを通じて、Gemini Roboticsが倫理的およびセキュリティ基準を開発することを保証します。
Gemini Roboticsの実装を加速するために、GoogleはApptronik、Agile Robots、Agility Robotics、Boston Dynamics、Enchanted Toolsなど、いくつかのロボット企業と協力しています。これらのコラボレーションは、より多くの分野でのジェミニロボットの適用を促進し、私たちの生活と仕事により多くの利便性をもたらします。
GoogleのGemini Roboticsは、間違いなく人工知能とロボット工学の分野に新しい活力を注入しました。その強力なマルチモーダル理解能力、優れた一般化、自然な人間コンピューターの相互作用、優れた運用スキルはすべて、インテリジェントロボットの時代の到来を告げています。ホームアシスタントとして、または産業、医療、その他の分野でのアプリケーションであろうと、ジェミニロボットは前例のない利便性と効率性をもたらします。
公式ブログ:https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/