![]()
Intelは、自社のGaudi 3ラックスケールソリューションをNVIDIAのテクノロジースタックと統合し、自社のAIチップとBlackwellを組み合わせることで、驚異的なパフォーマンス向上を実現したと報じられています。
Intel、NVIDIAのBlackwellテクノロジーを搭載したハイブリッドAIサーバーを発表。驚異的なパフォーマンスを謳う
IntelのAIチップ、特にGaudiシリーズが業界で広く採用されていることは周知の事実です。
AI市場における収益面では、NVIDIAやAMDなどの競合他社に比べて苦戦を強いられてきましたが、現在、IntelはGaudiプラットフォームの販売に新たな道を切り開いているようです。
SemiAnalysisによると、Intelは顧客に新しいGaudi 3ラックスケールシステムを提供する予定です。
このシステムは、ハイブリッド構成のNVIDIA Blackwell B200 GPUとConnect-Xネットワークを搭載します。
Intel just took another step on combining forces 🔥 with NVIDIA by integrating their new Gaudi3 rack scale systems together with NVIDIA B200 via disaggregated PD inferencing. Intel claims that compared their B200 only baseline, and inferencing system using Gaudi3 for decode part… pic.twitter.com/jAKin6rgZx
— SemiAnalysis (@SemiAnalysis_) October 18, 2025
翻訳
インテルは、NVIDIAとの連携をさらに一歩進め、 新しいGaudi3ラックスケールシステムをNVIDIA B200と分散型PD推論を通じて統合しました。
インテルは、B200のみのベースラインと比較して、デコード部分にGaudi3、プリフィル部分にB200を使用し、Nvidia ConnectX-7ネットワーキングで接続した推論システムは、小規模な高密度モデルにおいてTCOあたりのパフォーマンスが1.7倍向上すると主張しています。
これは、Gaudi3をNvidiaのオープンソースApache2 Dynamoフレームワークに統合することで実現されると考えています。 インテルは、売れ残っているGaudi3チップの大量の倉庫在庫を抱え、Gaudiシステムレベルを再設計し、スケールアップのワールドサイズを8チップから64チップに拡大しました。
これは、Broadcom 51.2T Tomahawk5スイッチを使用することで実現されています。
なお、スケールアップスイッチトレイの前面OSFPケージを使用して、クロスラックDAC/AECイーサネットケーブルを介して128チップ以上のさらに大きなスケールアップドメインを構築するオプションもあります。
既存のGaudi3デザインでは、スケールアウトネットワーキングはGaudi3に統合されたRDMAイーサネットNICを介して行われていましたが、新しいラックスケールGaudi3デザインでは、NVIDIA 400GbE ConnectX-7 NICを介してスケールアウトが行われ、Gaudi3がNVIDIA B200 GPUと通信できるようになっています。
これは、インテルのAIチップをNvidiaのネットワーキングエコシステムに取り込む、200IQのジェンセン流「取引の芸術」パートナーシップです 。
とはいえ、Gaudi3のソフトウェアスタックは依然として未熟でクローズドソースであり、誰も使いたがらないため、巨大な在庫が発生しています。
インテルがGaudi3を売る唯一の方法は、さらに低い販売ASPを設定することです。
この発表は、Gaudi3をシステムレベルで支援するものであり、ソフトウェアレベルでは改善されていません。
Gaudi3のPyTorchは依然としてクローズドソースであり、オープンソースのPyTorchにアップストリームされていません。
これは、インテルのGPUソフトウェアスタックとは異なり、PyTorchの統合が部分的にオープンソース化され、アップストリームされているものの、インテルGPU/oneAPI/oneDNNには多くの専用PyTorchユニットテストが壊れており、インテルGPUにはPyTorchインダクターCI統合が欠けています。
Gaudi3がGaudiアーキテクチャの終焉であることを考えると、インテルがPyTorchソフトウェア層をアップストリームしてオープンソース化する方向にさらにエネルギーを投資するか、インテルGPUソフトウェアスタックに注力するかは難しい選択です。
これはOCP Global Summitでの注目すべき発表の一つだったようです。
Team BlueはラックスケールAIセグメントを独自の方法で活用する計画です。このシステムがどのように展開されるかについて考えてみましょう。
これはユニークな実装で、IntelのGaudi 3 AIチップが推論ワークロードの「デコード」部分をターゲットとし、B200がよりアグレッシブな「プリフィル」段階を担当します。
Blackwell GPUは、プラットフォームの高性能性により、フルコンテキストにわたる大規模な行列乗算バーストで最高のパフォーマンスを発揮することが知られています。
そのため、ここではプリフィルワークロードを割り当てることが適切な選択です。

このセットアップに搭載されたIntelのGaudi 3は、ラックスケールの組み合わせにおいてメモリ帯域幅とイーサネット中心のスケールアウトに重点を置いているため、このセットアップは理にかなっていると言えるでしょう。
ネットワーク面では、コンピューティングトレイにはNVIDIAのConnectX-7 400 GbE NICが、ラックスケールにはBroadcomのTomahawk 5 51.2 Tb/sスイッチが採用されており、オールツーオール接続を実現しています。
SemiAnalysisによると、コンピューティングトレイには2基のXeon CPU、4基のGaudi 3 AIチップ、4基のNIC、そして1基のNVIDIA BlueField-3 DPUが搭載されており、ラックあたり合計16基のトレイが配置されています。

Gaudiプラットフォームは、NVIDIAが支配するエコシステムにおいて、コスト効率の高いデコードエンジンとして自らを位置づけています。
そのため、ここでのアプローチは、控えめに言っても「勝てないなら、仲間になる」というものです。
このラックスケール構成は、小型高密度モデルにおいて、B200のみのベースラインと比較して、プレフィル性能が1.7倍高速化されると謳われていますが、この性能はまだ独立したテストを受けていません。
このアプローチはIntelにとって有利です。Gaudiプラットフォームをラックスケールシステムにバンドルすることで収益化できるからです。
NVIDIAにとっては、自社のネットワーク機能が最高レベルであることを確信したことになります。
このハイブリッド構成は楽観的に聞こえますが、Gaudi AIプラットフォームのソフトウェアスタックはまだ未成熟であり、採用は限定的になるでしょう。
Gaudiアーキテクチャは数ヶ月以内に段階的に廃止される予定であるため、このラックスケール構成が他の選択肢と同程度の普及率に達するとは考えにくいでしょう。
解説:
NVIDIAがIntel Gaudi3の在庫処分に協力。
B200のシステムに組み込み、推論ワークロードを割り当てることでB200のみのシステムよりも1.7倍高速化するというものです。
この話を聞くといくつかの疑問が出てくるものの、こんな短期間の間に倉庫に積みあがってるどうしようもないチップをとりあえず使い物になりそうな製品に仕上げるところはさすが、NVIDIAといった感じです。
これだけ聞くとIntelとNVIDIAの協力関係は保護者と子供といった様相です。
とても互恵関係とは言えないので、これからNVIDIAの要求にも従っていくものと思います。
しかし、
このハイブリッド構成は楽観的に聞こえますが、Gaudi AIプラットフォームのソフトウェアスタックはまだ未成熟であり、採用は限定的になるでしょう。
とありますのでこれでも売るのは簡単ではなさそうです。
ラックスケールでの展開をまったく考えられていなかったGuadi3をラックスケールにして売るのは大変なのでしょう。
大人気のBlackwellと倉庫で埃をかぶっているGaudi3、この対照的な製品を組み合わせたシステムは倉庫の在庫を一掃し、intelの救済策になり得るでしょうか?
普通なら倒産一直線なのでしょうが、このように救済される当たり、Intelはアメリカにとって特別な企業なのでしょうね。