NVIDIAはNemotron 3モデルファミリーを発表し、Nano・Super・Ultraの3サイズすべてについてトレーニングデータセット・手法・モデル重みをオープンソースとして公開しました。中でも「Nemotron 3 Nano Omni」はMamba-Transformerを組み合わせたMoE(Mixture of Experts)ハイブリッドアーキテクチャを採用し、テキスト・画像・動画・音声の4モダリティをネイティブにサポートする真のマルチモーダルモデルとして登場しています。
NVIDIAの発表によると、Nemotron 3 SuperはいくつかのベンチマークでDeepSeekとGPT系オープンソースモデルを上回る性能を示しており、企業向けの微調整(ファインチューニング)を意識した設計となっています。NVIDIAはこれまで主にGPU・CUDAエコシステムとNIM(NVIDIAインファレンスマイクロサービス)という推論インフラの提供者として位置づけられていましたが、今回のNemotron 3は同社が「モデルそのもの」でも競争する意志を明確に示したリリースと言えます。すべてのコンポーネントをオープンにする戦略は、開発者コミュニティの取り込みを狙ったものでしょう。
X上では「DeepSeekを上回るオープンソースモデル」という評価が拡散し、NVIDIAのソフトウェアエコシステムへの本格参入を歓迎する声が多く上がりました。r/LocalLLaMAでは、Nemotron 3 SuperがDeepSeekとGPT-OSSを上回るという主張への検証スレッドが立ち上がり、各種ベンチマークの信頼性についての議論が活発化しています。Hacker Newsでは「NVIDIAがチップ販売だけでなくモデル自体でも競争する戦略シフト」として注目され、垂直統合によるエコシステム囲い込みへの懸念を示す声も上がりました。
NVIDIAがハードウェアとソフトウェアとモデルの三位一体で展開するエコシステム戦略は、Appleが独自シリコンとOSとアプリを統合してきた手法を想起させます。CUDA上での最適化された推論パフォーマンスという強みと組み合わせることで、Nemotron 3はエンタープライズ向けオープンソースモデルの有力な選択肢として浮上してくる可能性があります。