クロックが足りず、コアも足りない。
AppleのM2 Ultraは、24個の汎用コアと最大76個の統合GPUコアを持つ強大なプロセッサーです。
また、2019年のMac Proに搭載されたIntelの28コアXeon Wよりもおそらく速いので、新しいMac Proワークステーションのオーナーは、大幅な性能アップを感じることができるでしょう。
しかし、とあるベンチマークによると、このCPUはGeekbench 5(via@VadimYuryev)において、非常に高いクロックを誇ったり、手ごわいコア数を特徴とするAMDやIntelの競合製品に勝つことができないそうです。
ヘビーデューティ・ワークステーショングレードのプロセッサーは、デスクトップやサーバーのCPUとは異なり、(すべてのクライアントプロセッサーと同様に)非常に応答性の高いパフォーマンスと、重い作業負荷の下で一貫して高いパフォーマンスの両方を実現する必要があります。
つまり、クロックあたりの命令数が多いこと、クロック数が多いこと、コア数が多いこと、大容量メモリをサポートしていること、PCIeレーンを多く備えていることが求められます。
AMDのRyzen Threadripper Pro W5995Xは64コア、IntelのXeon W9-3495Xは56コアでこれらの要件に準拠しています。
一言で言えば、必要なときに極めて高いクロックを提供できるように構成されたサーバーシリコンを使っているのです。
AppleのM2 Ultraに関しては、主にMacBook ProとMac Studioマシン向けに設計された2つのM2 Maxシステムオンチップから構成されています。
これらのワークステーションは、消費電力が控えめで、拡張性をサポートしていません。
コンパクトなPCに搭載できるメモリやストレージは限られているため、M2 Maxは高クロックや拡張性を重視して設計されたわけではありません。
M2は、計算量の多いワークロードが出現したときに極端にクロックを上げる代わりに、内蔵の特殊用途アクセラレータを使用します。
また、電力と冷却の制限から、極端なコア数には設計されていません。2台のM2 Maxは書類上では強力に見えますが、インテルのCore i9-13900KやAMDのRyzen Threadripper Pro W5995WXのコア数に匹敵するクロックを誇れるものではありません。
M2 Ultra | Xeon W9-3495X | Ryzen Threadripper Pro 5995WX | Core i9- 13900K | |
General specifications | 24C/24T, 最高3.68 GHz | 56C/112T, 1.90 GHz - 4.60 GHz, 105MB L3 | 64C/128T, 2.70 GHz - 4.50 GHz, 256MB L3 | 8P+16E/32T, 3.0 GHz - 5.80 GHz, 68MB L2+L3 キャッシュ |
シングルコア 整数演算 | 1,793 | 1,522 | 1,316 | 2,016 |
シングルコア 浮動小数点演算 | 2,149 | 1,815 | 1,719 | 2,464 |
シングルコア 暗号化 | 2,912 | 3,926 | 3,832 | 5,860 |
シングルコア 総合スコア | 1,956 | 1,730 | 1,563 | 2,343 |
マルチコア 整数演算 | 24,532 | 59,183 | 46,049 | 28,379 |
マルチコア 浮動小数点演算 | 32,195 | 55,393 | 49,414 | 31,320 |
マルチコア 暗号化 | 46,817 | 36,466 | 44,987 | 22,280 |
マルチコア 総合スコア | 27,945 | 56,910 | 47,005 | 28,956 |
リンク | 引用元 | 引用元 | 引用元 | 引用元 |
このため、ベンチマーク結果では、AppleのM2 Ultraはシングルスレッド・ワークロードでインテルのCore i9-13900Kに勝てず、Geekbench 5のマルチコアワークロードでは遅れをとることさえあります。
インテルのデスクトップ製品は、同時マルチスレッドに対応しており、最大32スレッドを瞬時に処理することができます。
実際のライバルであるAMDのRyzen Threadripper Pro W5995XやIntelのXeon W9-3495Xと比較すると、シングルスレッド・ワークロードでは簡単に勝てるものの、より多くのコアが必要になると劇的に遅くなってしまう。
Geekbench 5は合成ベンチマークであり、実世界のアプリケーションにおける性能を反映していないという意見もあるかもしれませんし、それは正論です。
しかし、特別な目的のアクセラレータがない場合のCPUの計算能力に関して、何を期待すべきかを教えてくれる。
そして、このことから、AppleのM2 SoCは、内部に十分なアクセラレータを搭載しているという事実が浮かび上がってきます。
したがって、多くのワークステーション級のワークロードで優れた性能を発揮するために、高クロックや極端なコア数を必要としないかもしれません。
そしてまた、これだけの計算馬力を搭載したAMDとIntelのワークステーション・プロセッサーは、最も要求の厳しいワークロードにも対応できるように設計されています。
とはいえ、AppleのMac Proが、ワークステーション用途でAMDやIntelのCPUを搭載したワークステーションに実際に勝てるかどうかは、まだわからない。
ソース:Tom's Hardware - Apple's M2 Ultra Seemingly Can't Beat AMD and Intel Rivals
解説:
M2 UltraをAMD,IntelのCPUと比較した結果
私が前から主張している通りの結果になっています。
M2 Ultra(76GPUコア)は26.98TFLOPSの内蔵GPUを搭載しています。
つまり、PS5に搭載されている内蔵GPUより2.5倍以上強力なGPUをCPUと同一パッケージ上にのせているわけです。
対して今回比較されているCPUは内蔵GPUが搭載されている製品もありますが、基本的に高性能なGPUを使いたいときは拡張スロットにdGPUを挿すことを前提に設計されているものです。
Appleがマーケティング上そのように宣伝しているので比較しているのでしょうが元々があまりフェアな比較で無いことはお断りしておきます。
条件を聞いただけでM2 Ultraに勝ち目がないとわからない人はちょっと頭悪いと思います。
同じヘテロCPUの13900Kと比較しても負けています。
面白いことにコア数は全く同じですが、
- M2 UltraはPコア16、Eコア8
- 13900KはPコア8、Eコア16
とPコアとEコアを見るとそれぞれコア数は逆になっています。
この辺にARMとx86の違いと両社の設計の差が出ているのではないかと思います。
M2 Ultraのフェアな性能は内蔵GPUを取っ払うか小さくして、コア数を増やして高クロック寄りに最適化する必要があるんじゃないかと思います。
また、Macは単一の機種ですので、最適化がしやすいという事情もありますのでそれを考えると面白い結果になるんじゃないかと思います。
この辺はPS5と似たような感じですね。
PS5の方がクロックも低くてGPUの性能も劣っているのに出るゲームのパフォーマンスでPCに勝っていることもある(ゲーム会社の技術力にもよる)のは単一の機種のために最適化がしやすいからでしょう。
私はMacがあまり好きではありませんが、この比較はあまりフェアな比較とは言えないかなと思います。
例えるならばレーシングカーとGTカーを比較するようなものです。
M2 Ultraはミドルクラスの強力な内蔵GPUを搭載している都合上、CPUには全振り出来ません。
内蔵GPUは26.98TFLOPSですから、FP32演算性能で比較するとなんとRTX4060Tiより強力な内蔵GPUと言うことになります。
対して、AMDのRyzen7000シリーズや今回比較対象に挙がっている13900Kは内蔵GPUではとても最新のAAAタイトルはプレイできないでしょう。
比較するとしたら発売予定のZen5のAPU、Strix Haloが丁度良いのではないかと思います。
恐らく、M2 Ultra(かM3の後継製品)が勝つと思いますが、ここでAppleシリコンの凄さが実感できると思います。