NVIDIAは2026年4月28日、「Nemotron 3 Nano Omni」をリリースしました。総パラメータ数30B(アクティブ3B)のMoE(Mixture of Experts)構造で視覚・音声・テキストを単一モデルで処理し、従来のオープンマルチモーダルモデルと比較して最大9倍のスループットを実現しています。Hugging Faceや25以上のパートナープラットフォームで公開されており、エッジデバイスへの展開も視野に入れた設計となっています。
NVIDIA公式の発表によると、Nemotron 3 Nano OmniはMoE構造を採用しており、推論時には全30Bパラメータのうち3Bのみをアクティブ化します。これにより、大規模モデルの性能を維持しながら、実際の計算負荷を小型モデル相当に抑えることができます。最大9倍のスループット向上は、同等の出力品質を維持しながら処理速度を大幅に高めた結果とされています。視覚・音声・テキストのネイティブ統合処理は、カメラ映像の解析・音声命令への応答・テキスト処理を単一モデルで扱えることを意味し、IoTデバイスやロボット、エッジAIシステムへの応用が特に有望とされています。
NVIDIAの公式発表後、エッジAIコミュニティからは「小型デバイスでのエージェント展開の可能性が広がった」と好意的な反応が見られました。r/LocalLLaMAでは「30Bでもアクティブパラメータが3Bなので、一般的なGPUでも動く可能性がある」という実験報告が相次いでいます。Hacker Newsでは「NVIDIAがオープンモデルで自社エコシステムを強化する戦略は明らか」という見方と、モデルの実性能についての議論が展開されており、NVIDIAのGPUでの動作最適化に対するビジネス意図を指摘するコメントも多く見られました。
NVIDIAにとってNemotronシリーズのオープン公開は、自社のGPUハードウェアとCUDAエコシステムを中心とした開発者コミュニティを強化する戦略的な意図があります。25以上のパートナープラットフォームへの展開は、単なるHugging Faceへの公開にとどまらず、産業用・商用AIシステムとの統合を加速させる狙いがあるとみられます。
オープンマルチモーダルモデルの競争はGemma 4・DeepSeek V4との三つ巴になりつつあり、エッジデバイスへの展開という観点では今後さらに性能・コスト・ライセンスの面でモデル選択の幅が広がることが期待されます。