← 2026-06-05
Open Source Community 2026-06-05 Source →

NVIDIAがNemotron 3 Ultra(550B MoE)をリリース:北米オープンウェイト最強クラス、エージェント処理を5倍高速化

NVIDIAが新たなオープンウェイトモデル「Nemotron 3 Ultra」を発表しました。Mamba-Transformerハイブリッドアーキテクチャを採用した550Bパラメータ(アクティブ55B)のMoE(Mixture of Experts)モデルで、Amazon SageMaker JumpStartを通じて提供されます。エージェント型AIワークロードでは前世代比で5倍の高速化と30%のコスト削減を実現しており、北米産オープンウェイトモデルの中では現時点で最強クラスと評価されています。

NVIDIAによると、Nemotron 3 Ultraは100万トークンのコンテキストウィンドウに対応しており、長文書類の分析や複雑なマルチステップのエージェントタスクに適しています。MoEアーキテクチャの活性化率は約10%(総パラメータ550Bに対しアクティブ55B)で、DeepSeek系モデルと比べてやや高めの密度設定になっています。この設計が性能とコストのバランスにどう影響するかは、コミュニティで活発な議論のテーマとなっています。

X(旧Twitter)では「NVIDIAが自社GPUの優位性を示すためにオープンモデルを強化する戦略を取っている」という分析が広がっており、同社がGPU販売と並行してモデルエコシステムも囲い込む動きを加速させていると見られています。Hacker Newsでは「MoEの活性化率がDeepSeekより高いことの意味を考察するスレッドが人気」を集め、「コスト効率の主張は独立ベンチマークでの確認待ち」という慎重なコメントが多数寄せられました。一方r/LocalLLaMAでは「300+ tok/sの推論速度は驚異的」という実測値への期待が高まっており、実機評価レポートを待ち望む声が上がっています。

NVIDIAがモデル開発に本腰を入れる背景には、AIチップ市場の覇権だけでなく、推論プラットフォームとしての地位確立という戦略的意図が読み取れます。SageMakerとの統合によりAWS上での即時利用が可能な点は、エンタープライズ採用を加速させる要因になるでしょう。オープンウェイトの競争が一段と激化する中で、同モデルの独立した性能評価の結果が今後の評価を大きく左右しそうです。

関連リンク