NVIDIAは新たなオープンモデルファミリー「Nemotron 3」を発表しました。NanoモデルはNemotron 2比で4倍のスループットを達成しており、マルチエージェントシステム(複数のAIエージェントが連携して動作する仕組み)向けに現時点で最高のトークン生成速度を誇るオープンモデルとして位置づけられています。NVIDIAがGPU販売だけでなく、ソフトウェアとモデルの両面でAIエコシステムを押さえようとする戦略が改めて鮮明になっています。
NVIDIAのプレスリリースによると、Nemotron 3 Nanoはエッジデバイスや比較的低スペックのGPUでも高速なトークン生成を実現するよう設計されています。マルチエージェントシステムでは、複数のモデルインスタンスが並列で動作し互いに情報をやり取りするため、1秒あたりの生成トークン数(スループット)が全体の処理速度のボトルネックになりやすいという特性があります。Nemotron 3 Nanoの4倍向上はこのボトルネック解消に直接寄与し、エージェント間の連携応答時間を大幅に短縮できます。
Redditでは「エッジデバイスでのエージェントAI実行を試みる開発者から好評」との反応が見られ、NVIDIAのJetson系ハードウェアとの組み合わせを検討する投稿が目立っています。Llama 4との比較レポートも続々と投稿されており、特定のタスクではNemotron 3の方が高速だという報告がある一方、汎用性ではLlamaシリーズが上回るという見方も多いようです。
NVIDIAがオープンモデルを提供することには、GPU販売促進という側面もあります。Nemotron 3で最高のパフォーマンスを引き出すにはNVIDIA製GPUが最適化されているため、モデルの普及がGPU需要の下支えになるという構図です。オープンソースコミュニティへの貢献という形を取りながら、自社ハードウェアのエコシステムを強固にするNVIDIAの戦略は一貫しています。
Nemotron 3はNVIDIA NIMマイクロサービスを通じたデプロイにも対応しており、企業向けの容易な導入経路が確保されています。マルチエージェントAIの本番活用が加速する中で、スループット重視の軽量モデルへの需要は今後さらに高まるとみられます。