NVIDIAは2026年4月28日、マルチモーダルAIモデル「Nemotron 3 Nano Omni」をオープンモデルとして公開しました。総パラメータ3000億・アクティブパラメータ30億というMoE(混合エキスパート)アーキテクチャを採用し、テキスト・画像・音声を単一モデルで統合処理します。他のオープンマルチモーダルモデルと比較して最大9倍のスループットを実現しており、エッジデバイス上でのAIエージェント動作を想定した設計が特徴です。
NVIDIAのプレスリリースによると、Nemotron 3 Nano Omniはエッジでのリアルタイム処理を想定して最適化されており、フルHD(1920×1080)の画面録画をリアルタイムで処理できるオープンモデルとしては初の実用例と評されています。H CompanyのCEOがこの点を「革命的」と絶賛するコメントが拡散し、Palantir・Foxconnなど大企業による採用表明も相次いでいます。Nemotron 3ファミリー全体ではリリースから1年で5000万ダウンロードを超えており、エコシステムの成熟が証明されています。
X上ではH CompanyのCEOによる「実用的な初のオープンエッジマルチモーダルモデル」との絶賛コメントが広く共有されました。r/LocalLLaMAでは「クラウドへの依存なくエッジで視覚・音声・言語を同時処理できる点が革命的」との評価が多く、エンタープライズ向け機能と個人ユーザーへの制約についての議論も活発に行われています。Hacker Newsでは「NVIDIAがGPU販売だけでなくモデルエコシステムでも支配力を持とうとしている」という戦略的分析が注目を集め、同社がハードとソフトの両面で垂直統合を進める動きとして議論されました。
クラウドへの依存を減らしながら高度なマルチモーダル処理をローカルで実現するという需要は、プライバシー・コスト・レイテンシの観点から今後ますます高まると見られています。NVIDIAがモデルエコシステムを自社GPU消費につなげる戦略は明確ですが、開発者にとっては選択肢の増加として歓迎できる動きでもあります。