← 2026-03-19
Industry & Business Community 2026-03-19 Source →

NVIDIA GTC 2026でGroq 3 LPXとVera Rubinプラットフォーム発表:推論スループットがメガワットあたり35倍に

NVIDIAはGTC 2026で、エージェントAI時代を見据えた新プラットフォーム「Vera Rubin」と、推論専用アクセラレータ「Groq 3 LPX」を発表しました。7つの新チップがすでに量産体制に入っており、2026年後半から出荷が開始される予定です。

Vera Rubinプラットフォームは、Vera CPU、Rubin GPU、NVLink 6スイッチ、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6イーサネットスイッチ、そして新たに統合されたGroq 3 LPUの7チップで構成される統合AIスーパーコンピュータです。Vera Rubin NVL72ラックは72基のRubin GPUと36基のVera CPUを搭載し、NVIDIAによるとBlackwellプラットフォームと比較してGPU数を4分の1に削減しながら同等のトレーニング性能を実現します。

注目を集めるGroq 3 LPXは、低レイテンシと大規模コンテキストを要求するエージェントシステム向けに設計されています。256基のLPUプロセッサを搭載したLPXラックは128GBのオンチップSRAMと640TB/秒のスケールアップ帯域幅を備え、エージェント間通信で最大毎秒1500トークンのスループットを実現します。Vera Rubinとの組み合わせでは、メガワットあたり最大35倍の推論スループット向上と、1兆パラメータモデルで最大10倍の収益機会をもたらすとNVIDIAは主張しています。

X上では、推論特化への戦略シフトとCPUが中心的役割を果たす新時代への注目が集まっています。Hacker Newsでは、2028年予定のFeynmanアーキテクチャのプレビューも公開されたことで、NVIDIAの長期ロードマップへの関心が高まっています。

AWS、Google Cloud、Microsoft Azure、Oracle Cloudなどの主要クラウドプロバイダーに加え、Dell、HPE、Cisco、Lenovo、Supermicroなどのシステムメーカーを通じて2026年後半から提供開始予定です。Jensen Huang CEOは基調講演で、BlackwellとVera Rubinの2027年までの受注が1兆ドルに達する見通しを明らかにしています。

関連リンク

- [NVIDIA Vera Rubin Opens Agentic AI Frontier NVIDIA Newsroom](https://nvidianews.nvidia.com/news/nvidia-vera-rubin-platform)
- [GTC 2026: With Groq 3 LPX, Nvidia adds dedicated inference hardware The Decoder](https://the-decoder.com/gtc-2026-with-groq-3-lpx-nvidia-adds-dedicated-inference-hardware-to-its-platform-for-the-first-time/)
- [Inside NVIDIA Groq 3 LPX NVIDIA Technical Blog](https://developer.nvidia.com/blog/inside-nvidia-groq-3-lpx-the-low-latency-inference-accelerator-for-the-nvidia-vera-rubin-platform/)