OpenAIがNVIDIA・Groq連合の最大顧客に──3GWの推論キャパシティをコミット、GTC 2026での正式発表へ

Wall Street Journal（WSJ）の2026年2月27日の報道により、NVIDIAがGTC 2026（3月15日〜、米カリフォルニア州サンノゼ）でGroq技術を組み込んだ新型AI推論プロセッサを正式発表する計画であることが明らかになった。

OpenAIはこの新ソリューションの最大顧客となることで合意しており、3GW分の「専用推論キャパシティ」をNVIDIAにコミットすることが判明している。

この3GWというコミットメントは、NVIDIAがOpenAIに対して実施した最大300億ドル規模の投資と連動する形で取り付けたものとみられている。

OpenAIはこれとは別に、SoftBank・Amazon・NVIDIAなどからの出資を含む総額1,100億ドルの資金調達も発表しており、AI開発に必要な計算リソースの確保を積極的に進めている。

今回の決定に至るまでの経緯として、OpenAIはCerebrasおよびGroqとの間でも低レイテンシワークロード向けの推論チップ供給契約の交渉を進めていたことが複数の関係者の証言で明らかになっている。

しかしNVIDIAがGroqと最大200億ドル規模のライセンス契約を締結したことで、OpenAIとGroqの独自交渉は事実上打ち切られた形となった。

Reutersの報道によれば、OpenAIはNVIDIAの既存GPU製品では特定の推論ワークロード（特にコード生成やAIエージェント間通信）の速度が不十分であることに不満を抱いており、将来的に推論処理需要の約10%を賄える新たなハードウェアを求めていたとされる。

NVIDIAがGroqに注目する理由は、同社のLPU（Language Processing Unit）が持つ独自のアーキテクチャにある。

GroqのLPUはHBM（広帯域メモリ）ではなく、オンチップSRAMに大容量メモリを搭載する設計が特徴で、コンパイラが全ての演算とデータ転送を事前にスケジューリングする「決定論的実行」を採用している。

この仕組みにより、GPUが苦手とする小バッチ・低レイテンシの推論処理で圧倒的なパフォーマンスを発揮し、独立したテストではライバル製品の約2倍の速度を記録したとされている。

NVIDIAのCEOジェンスン・ファン氏はQ4 2026決算説明会において、Groq統合をかつてのMellanox買収と同様の戦略的役割と位置づけると発言した。

MellanoxはNVIDIAのネットワーキング（InfiniBand）を強化し、GPUクラスタの通信ボトルネックを解消した存在だ。

ファン氏の発言は、LPUがNVIDIAのGPUを「置き換える」のではなく「補完する」アクセラレーターとして機能するという構想を示唆している。

現在業界で有力視されているのは「LPXラック」と呼ばれるハイブリッド構成で、1ラックあたり256基のLPUを搭載する設計が検討されているとされる。

LPU同士はスイッチレスの直接接続トポロジー（RealScaleネットワーク）で繋がれ、LPUとGPU間はNVLink Fusionで接続することで、プリフィル段階のKVキャッシュをGPUからLPUに大規模オフロードすることが可能になると予想されている。

GTC 2026ではLPXラックのほか、HBM4ベースの次世代GPU「Vera Rubin」および将来世代の「Feynman」アーキテクチャに関する発表も予定されており、AIインフラの全体像が大きく更新される見込みだ。

一方、AI業界全体のハードウェア戦略は分岐しており、AnthropicはAmazonのTrainium、GoogleのTPUを中心に活用を続けており、OpenAIとは異なるアプローチを維持している。

正直なところ、このニュースで一番注目すべきなのは「3GW」という数字の大きさです。

現在世界最大級のデータセンターですら1〜2GWの電力消費規模なので、3GWというコミットメントは単一用途としては途方もない量です。

OpenAIがChatGPTをはじめとするサービスの推論処理にどれだけの計算リソースを必要としているか、その規模感が改めて浮き彫りになりました。

もう一つ重要なのが、OpenAIがCerebrasやGroqと独自交渉を進めていたという事実です。

つまりOpenAIは「NVIDIAのGPUだけでは推論が間に合わない」と判断し、本気で他社チップへの乗り換えを検討していたわけですね。

ところがNVIDIAはその「逃げ道」だったGroqと先に200億ドルの契約を結び、実質的にOpenAIの選択肢を封じた形になった。

これはNVIDIAの買収戦略として非常にスマートな動きだと思います。

個人的に面白いと思うのが、ジェンスン・ファン氏がGroqをMellanoxに例えた点です。

Mellanox買収（2020年）は当時「高い」と批判されましたが、結果的にNVIDIAのGPUクラスタにInfiniBandを統合し、AIトレーニング市場での独占的地位を確立する鍵になりました。

同じ図式が推論市場でも繰り返されようとしているわけです。

GPUはトレーニングとプリフィル（文章の文脈を処理する前半部分）は得意ですが、トークンを1つずつ生成するデコード段階（後半部分）では大量の並列コアを持て余してしまいます。

ここにLPUを組み合わせることで、処理の「前半はGPU、後半はLPU」という役割分担ができ、低レイテンシと高スループットを両立できる、というのがNVIDIAの描く絵図です。

ただし、懐疑的な視点も持っておく必要はあります。

LPXラックの256 LPU構成や、NVLink Fusionとの統合は現時点では予測・リーク情報の域を出ておらず、GTC 2026で何がどこまで具体的に発表されるかはまだ不明です。

Feynmanアーキテクチャの製品化が2028〜2030年と報じられていることを考えると、今回のGTC発表はロードマップの公開が中心になる可能性が高いでしょう。

それでも「OpenAIが最大顧客として3GWをコミットした」という事実は、NVIDIA-Groq連合の技術的な説得力がすでに相当高いことを示しています。

GTC 2026は3月15日からです。

ジェンスン・ファン氏が「世界が見たことのない技術」と予告しているだけに、正式発表の内容は要注目です。