NVIDIAの世界基盤モデル(ワールドファウンデーションモデル)「Cosmos」をトヨタリサーチインスティテュート(TRI)がカスタマイズし、動的ビュー合成・遠隔操作データ拡張・ナビゲーション世界モデルの3分野でそれぞれ最先端の結果を達成したことが発表されました。あわせてNVIDIA Isaac GR00Tの新しいオープンモデルが公開され、ロボットが自然言語の指示を理解し複数ステップの作業を実行できるようになっています。
Cosmosは3Dシミュレーションと実世界の物理特性を学習した大規模モデルで、ロボットが実際の環境でどう動くかを事前に予測・計画するための基盤として機能します。TRIはこのモデルを実際のロボット制御に組み合わせることで、シミュレーション上の訓練データを現実のロボット動作に転移させる「Sim-to-Real」の壁を大幅に低くすることに成功しました。X上では「Physical AI」という概念への注目が急速に高まっており、「ロボティクスはAIの次の主戦場」とする投稿が多数見られます。NVIDIAの株価上昇の支持材料として言及するコメントも相次いでいます。
Hacker Newsでは「Boston DynamicsとDeepMindのGemini Robotics連携と合わせ、大手各社がPhysical AIに本格投資している」との分析が上位スレッドに登場しており、今回の発表が単発ではなく業界横断的なトレンドであることが裏付けられています。r/roboticsの専門家コミュニティでも「世界基盤モデルをロボット制御に応用するアプローチは理論的に正しい方向」との評価が高評価を集めています。一方で実際の工場導入までのギャップを問う声もあり、デモとプロダクションの距離はまだ遠いとの見方も根強くあります。
自動車メーカーが世界トップクラスのAIインフラ企業と組んでロボティクスの最先端研究を進めるという構図は、製造業がAI技術の単なる「消費者」から「共同開発者」へと変わりつつあることを示しています。工場ロボット・サービスロボット・自動運転のいずれも物理世界との接点を持つ点で共通しており、Cosmosのような世界モデルはこれらを横断する共通基盤になり得ます。2026年はロボティクスとAIの融合が加速する転換点として記憶されるかもしれません。