昨日リークされたIntelのSapphire Rapids-SP Xeon Platinum CPUは、現在様々なベンチマークでテストされていますが、AMDのEPYCやさらに古いIntel Xeonチップと比較すると、印象づけることができません。
Intel Sapphire Rapids-SP Xeon Platinum ES CPUsがデュアルソケット構成でテスト、AMDのEPYC CPUに対して今のところ精彩を欠くパフォーマンス
昨日のリークでは、ES状態の最新Intel Sapphire Rapids-SP Xeon Platinum CPUの消費電力がPL1で350W、PL2制限で420Wになることをお伝えした。
CPU自体は、Xeon Platinum 8476またはXeon Platinum 8480で、Golden Coveコアアーキテクチャに基づく112スレッドの56コア製品となり、&L2キャッシュ112MB&L3キャッシュ105MBを搭載し、クロックは最大3.7GHz(オールコア3.3GHz)であることが特徴となっている。
最終的なクロックではないが、Intelの次期製品としては気になる消費電力の数値であることは間違いない。
Yuuki_Ans氏は今回、同じIntel Sapphire Rapids-SP ES CPUについて、IntelのCascade Lake Xeon 8280L(8S Config)、Ice Lake Xeon 8380(2S Config)、EPYC 7763(2P Config)、EPYC 7773X(2P Config)とのベンチマークを提供した。
また、Sapphire Rapids-SPチップは、64GBのDDR5-4800メモリでデュアルソケット構成で動作していた。
それ以外のプラットフォームは、それぞれプラットフォームがサポートできる最大スペックでDDR4プラットフォームが動作していた。
※ 画像をクリックすると別Window・タブで拡大します。
ベンチマークについては、シングルコアでは、Intel Sapphire Rapids-SP CPUは、Ice Lake-SPチップより若干のブーストを見せたものの、6ベンチマーク中4ベンチマークでAMDのEPYC Milan製品に負けました。
新しいGolden Coveアーキテクチャを採用しているにもかかわらず、このCPUは1T CPUベンチではZen 3サーバーチップに匹敵する程度であった。
マルチスレッドベンチマークでは、AMD EPYC MilanのラインナップがIntel Sapphire Rapids-SPチップを完膚なきまでに叩きのめした。
比較のため、CPU-zでは、AMD EPYC Milan CPUは、未発表のIntelチップよりも最大で2.3倍速いパフォーマンスで動作した。
※ 画像をクリックすると別Window・タブで拡大します。
ESチップであり、QS状態のSapphire Rapids-SPチップのパフォーマンスは大幅に向上すると思われるが、AMDが次世代CPU「EPYC Genoa 7004」をガンガン投入してくるのと同時期に発売される一方で、最終チップはまだAMDのEPYC Milanパーツに対してしか対抗できないかもしれない。
このように消費電力が高く、手元の性能が十分でないため、Intelは、過去数世代にわたってそうであったように、サーバーセグメントでAMDから深刻な打撃を受けることになりそうです。
インテル Xeon SP ファミリ(予備):
ファミリ ブランド |
Skylake-SP | Cascade Lake-SP/AP |
Cooper Lake-SP |
Ice Lake-SP | Sapphire Rapids |
Emerald Rapids |
Granite Rapids |
Diamond Rapids |
製造プロセス | 14nm+ | 14nm++ | 14nm++ | 10nm+ | Intel 7 | Intel 7 | Intel 3 | Intel 3? |
プラット フォーム名 |
Intel Purley | Intel Purley | Intel Cedar Island |
Intel Whitley | Intel Eagle Stream |
Intel Eagle Stream |
Intel Mountain Stream Intel Birch Stream |
Intel Mountain Stream Intel Birch Stream |
コア アーキテクチャー |
Skylake | Cascade Lake | Cascade Lake | Sunny Cove | Golden Cove | Raptor Cove | Redwood Cove? | Lion Cove? |
IPC 向上率 (対前世代比) |
10% | 0% | 0% | 20% | 19% | 8%? | 35%? | 39%? |
MCP (マルチ チップパッケージ) SKU |
No | Yes | No | No | Yes | Yes | 不明 (可能性有り) |
不明 (可能性有り) |
ソケット | LGA 3647 | LGA 3647 | LGA 4189 | LGA 4189 | LGA 4677 | LGA 4677 | 不明 | 不明 |
最大コア数 | 28 | 28 | 28 | 40 | 56 | 64 | 120 | 144 |
最大スレッド数 | 56 | 56 | 56 | 80 | 112 | 128 | 240 | 288 |
最大L3 キャッシュ |
38.5 MB L3 | 38.5 MB L3 | 38.5 MB L3 | 60 MB L3 | 105 MB L3 | 120 MB L3? | 240 MB L3? | 288 MB L3? |
ベクター エンジン |
AVX-512/FMA2 | AVX-512/FMA2 | AVX-512/FMA2 | AVX-512/FMA2 | AVX-512/FMA2 | AVX-512/FMA2 | AVX-1024/FMA3? | AVX-1024/FMA3? |
サポート メモリ |
DDR4-2666 6-Channel |
DDR4-2933 6-Channel |
最大6-Channel DDR4-3200 |
最大8-Channel DDR4-3200 |
最大8-Channel DDR5-4800 |
最大8-Channel DDR5-5600? |
最大12-Channel DDR5-6400? |
最大12-Channel DDR6-7200? |
PCIe世代 サポート |
PCIe 3.0 (48 Lanes) |
PCIe 3.0 (48 Lanes) |
PCIe 3.0 (48 Lanes) |
PCIe 4.0 (64 Lanes) |
PCIe 5.0 (80 lanes) |
PCIe 5.0 (80 Lanes) |
PCIe 6.0 (128 Lanes)? |
PCIe 6.0 (128 Lanes)? |
TDP範囲 (PL1) |
140W-205W | 165W-205W | 150W-250W | 105-270W | 最大350W | 最大375W? | 最大400W? | 最大425W? |
3D Xpoint Optane DIMM |
N/A | Apache Pass | Barlow Pass | Barlow Pass | Crow Pass | Crow Pass? | Donahue Pass? | Donahue Pass? |
競合 | AMD EPYC Naples 14nm |
AMD EPYC Rome 7nm |
AMD EPYC Rome 7nm |
AMD EPYC Milan 7nm+ |
AMD EPYC Genoa ~5nm |
AMD 次世代 EPYC (Post Genoa) |
AMD 次世代 EPYC (Post Genoa) |
AMD 次世代 EPYC (Post Genoa) |
発売年 | 2017 | 2018 | 2020 | 2021 | 2022 | 2023? | 2024? | 2025? |
解説:
Alderlakeとは裏腹にパッとしないGoldenCove Xeon
ハイブリッドはペテンか?パラダイムシフトか?
Zen3のRyzen5000シリーズを値下げに追い込み、絶好調のIntel AlderLakeですが、同じアーキテクチャーでシングルスレッド性能に定評のあるGoldenCoveを搭載しているにも関わらずどうもSapphire Rapids-SP Xeon Platinum ESのベンチマーク結果はパッとしないようです。
理由はいくつか考えられますが、コア数とスレッド数が同グレードのEPYCにかなわないことが理由の一つなのでしょう。
Xeonは56コア112スレッド、EPYCは64コア128スレッドで如何にGoldenCoveと言えども1ソケット当たり8コア16スレッドの差を覆すことはできなかったのでしょう。
今一つの原因は熱です。
性能が上がっていけば、仕事量が増え、その分発熱も増えます。
Sapphire Rapids-SP Xeon Platinum ESの製造に使われるIntel7はMillan/-Xの製造に使われるTSMC7nmとほぼ同じと言われています。
そのため、トランジスタの消費が激しい高性能コアを56も搭載すれば当然発熱が厳しくなり、ご自慢のシングルスレッド性能を支えるクロックが上げられないということになります。
強力なシングルスレッド性能を支えるGoldenCoveはトランジスタの消費も激しいです。
そのため、やはりMillan/-Xと同じだけのコア数は実装できなかったのでしょう。
AlderLakeはこの点をハイブリッドで補っています。
シングルスレッド性能が高いPコア(高性能コア)とマルチスレッド性能を効率よく稼ぐためのEコア(高効率コア)に分けて、Pコアは動作クロックで、Eコアはコアの数でそれぞれ勝負をかけるという「役割分担」を明確にしています。
これは、ある意味、「あまりEコアが使われない」ことを前提にしていると思われます。
サーバー用のCPUはこうはいきません。
科学技術演算にしてもPC仮想化にしても、サーバー用CPUのマルチスレッド性能を使い切ることを前提にしているソフトウェアが数多くあるからです。
コアによってベクターエンジンの種類がそろっていなかったり、性能が極端に違っていたりなどする必要もありませんし、違っていると却って顧客に対する性能とコストの関係の明確さやわかりやすさと言うものがそがれてしまいます。
よって、サーバー用のCPUは単一のコアで構成されています。
翻って、デスクトップ用のCPUは実際にマルチスレッド性能は使われることは無い「空虚な」性能であることを前提にEコアが実装されていると私は考えています。
この疑念は以前から持っており、Intelのファンからは「それは言い過ぎではないか?」とたしなめられていましたが、当のIntel社内でも案外EコアはEfficient Coreではなく、Empty Coreと呼ばれているのではないかと勘ぐっています。
Eコア自体が強力な拡張命令もマルチスレッドもない方が効率は良くなるという今までのCPUの進化を全否定するような仕様のコアですから、やはり、オールドPCファンには肯定しがたいものではあります。
ハイブリッドの仕組みそのものはIntelが今、直面している問題を解決するこの上もなく優れた仕組みだと思います。
それは否定しません。
AMDはTSMCの世界一の製造技術を前提にトランジスタの消費には無頓着に性能を上げてきました。
IntelはTSMCに後れを取るようになり、何とか効率を上げるためにハイブリッドを採用しました。
製造技術で先を行ったTSMCを使ったAMDと後れを取った自社Fabの苦しみから生まれたハイブリッド、両社の姿は対照的です。
実際、デスクトップPCではハイブリッドはこの上もなく有効と言うことは証明されていますので、サーバーではAMD優勢、デスクトップではintel優勢と言う状態はしばらく続くのではないかと思います。