ロボット技術の分野では、アメリカのスタートアップフィギュアAIは最近、Helixと呼ばれる大きなエンドサイドモデルをリリースし、ヒューマノイドロボット制御技術の大きなブレークスルーをマークしました。ヘリックスは、ヒューマノイド上半身(頭、胴体、手首、指を含む)全体の高周波の連続制御を可能にする最初の視覚言語アクション(VLA)モデルです。これは、ロボットが多くのトレーニングなしで自然言語の指示に基づいて直接タスクを実行できることを意味します。
図AIは、2つの補完的なシステムを確立することにより、視覚言語モデルの普遍性と速度の間の矛盾を解決します。 System Oneは、1秒あたり200の正確なアクションを実行できる高速反応の視覚モーション戦略モデルであり、System Twoは複雑なシナリオと自然言語を理解できるオープンソースの視覚言語モデルです。これらの2つのシステムにより、エンドツーエンドのトレーニングを通じて効率的な通信が可能になり、多様なタスクを実行する際にヒューマノイドロボットが直面する制限を克服できます。

さらにエキサイティングなのは、Helixが単一のロボットで実行できるだけでなく、デュアルマシンコラボレーションを実現できる最初のAIモデルでもあることです。一連のデモンストレーションでは、Helixを装備した2つのロボットが、目に見えない残骸の束との共同分類に成功しました。タスクを完了するために、ロボットは視覚的な「確認」を行い、お互いを調べて正確な情報伝達を確保する必要があります。この方法のヒューマンマシンコラボレーションの方法は、Helixの強力な能力を実証するだけでなく、ヒューマノイドロボットと人間の相互作用が将来より自然で効率的であることを意味します。

わずか500時間の高品質のデータの監督により、Helixは数千の小さな家庭用品を簡単に識別して処理できます。簡単な指示により、ロボットは実証されたことのないタスクを正確に完了し、その驚くべき柔軟性とインテリジェンスを示しています。

Helixの立ち上げにより、図AIはまた、目標が15億ドルである資金を積極的に調達しており、同社は395億ドルと評価されると予想されています。この数は、昨年と比較して14倍近く増加しており、ロボット工学の市場の大きな関心と可能性を反映しています。