NVIDIAは全米ロボティクス週間(4月)にあわせ、人型ロボット向け汎用基盤モデル「Isaac GR00T N1.6」を公開しました。自然言語命令からロボットの動作計画を生成するビジョン言語アクション(VLA)モデルで、Hugging FaceのオープンソースフレームワークLeRobotへの統合も発表。NVIDIA傘下の200万ロボット開発者とHugging Faceの1300万AIビルダーが同一エコシステムでつながる基盤が整いました。GR00T X-Embodimentデータセットのダウンロード数は1000万件を超えています。
TechCrunchは「NVIDIAはロボティクスのAndroid的プラットフォームを目指している」と評しており、GPUからソフトウェア・モデル・エコシステムまでを垂直統合する戦略の核心にGR00TシリーズとIsaacプラットフォームがあると指摘しています。GR00T N1.6はその最新版で、NVIDIA Developer Blogによると、前世代から以下の点が強化されています。推論・知覚機能の向上のためにCosmos-Reason-2B VLMを組み込んでネイティブ解像度対応を実現したほか、動作生成に使うDiffusion Transformerのレイヤー数を2倍(32層)に増強し、より滑らかで正確なロボット動作を可能にしました。さらに人型ロボット・移動マニピュレータ・双腕ロボットなど多様なプラットフォームの遠隔操作データを追加学習し、汎化性能を高めています。
Hugging FaceのLeRobotフレームワークとの統合により、研究者はGR00T N1.6を容易にファインチューニング・評価できるようになりました。r/MachineLearningでは「LeRobotとの統合でオープンソースロボティクスの裾野が一気に広がる」と好評価で、自分でロボット実験をしている個人開発者から「やっと試せる環境が整った」という声も上がっています。
X(旧Twitter)では「NVIDIAがロボティクスのAndroid的プラットフォームを狙っている」という分析が多く共有され、Hacker Newsでは「GPUメーカーがロボットOSまで支配するのか」という懸念と「垂直統合によって開発が加速する」という賛否両論のスレが人気を集めています。
これまでの産業用ロボットは特定のタスクに特化したプログラムで動いており、別のタスクへの応用には大幅な再プログラミングが必要でした。GR00T N1.6のような汎用基盤モデルは、自然言語で「このボトルを棚に並べて」と指示するだけで新しい動作を学習・実行できる方向性を示しています。データセットのダウンロード数1000万件超という実績は、世界中の研究機関や企業がすでにこの方向性に投資していることを示唆しており、製造・物流・介護など幅広い領域へのロボット応用が加速するきっかけとなる可能性があります。