Appleは、フラッグシップのM1 SOCであるM1 Ultraを発表し、そのCPU & GPUパフォーマンスに関して印象的な指標を提示しました。
Apple M1 Ultra SOCは、フラッグシップデスクトップIntel Alder Lake & NVIDIA RTX 3090チップよりも高速なCPU & GPUパフォーマンスを提供しながら、消費電力は低い。
Apple M1 Ultra SOCは、全く新しいApple UltraFusionアーキテクチャを採用した2つのM1 Maxチップを組み合わせたものです。
Ultra SOCは依然として5nmプロセスノードを利用していますが、プロセスノードの倍増により、同じパッケージ上に最大1,140億個のトランジスタを搭載することができます。
新しいUltraFusionアーキテクチャは、最大2.5TB/秒の低レイテンシープロセッサー間バンド幅と800GB/秒の高速メモリバンド幅を提供します。
インターコネクトアーキテクチャは、2つのチップ間で10,000以上の信号が接続されているのが特徴です。
Apple M1 Ultra SOCのローレベルビューでは、16個の高性能コアと4個の高効率コアからなる20コアのCPUを搭載していることがわかります。
従来のM1チップと同様に、高性能コアは192KB命令キャッシュ、128KBデータキャッシュ、48MBのL2キャッシュを備えたウルトラワイド実行アーキテクチャに基づいており、高効率コアは128KB命令キャッシュ、64KBデータキャッシュ、8MBのL2キャッシュを備えたワイド実行アーキテクチャに基づくものである。
また、M1ニューラルエンジンの一部として32個のコアがあり、最大で毎秒22兆回の演算を行います。
※ 画像をクリックすると別Window・タブで拡大します。
GPUも64コアとなり、8192個の実行ユニットで最大21TFLOPsの単精度演算性能、660GTexels/s、330GPixels/sと大幅にパワーアップしています。
Apple M1 Ultraのメディアエンジンは、2つのビデオデコードエンジン、4つのビデオエンコードエンジン、4つのProResエンコード/デコードエンジンを備えた最新のハードウェアアクセラレーションH.264、HEVC、ProRes&ProResで構成されています。
GPUは128GBのユニファイドメモリにアクセスすることができます。
Apple M1 Ultra SOCのCPU性能(対Intel Alder Lake):
※ 画像をクリックすると別Window・タブで拡大します。
Appleは、M1 Ultraが同じワット数でIntel Alder LakeデスクトップCPUのフラッグシップモデルであるCore i9-12900Kよりも最大90%高いパフォーマンスを発揮し、100W少ない電力を消費しながら同様のパフォーマンスを実現できると述べています。
また、Intel Xeon 16コアチップの90%以上の性能と、10コアのIntel Core i9デスクトップCPUの2.5倍の性能を提供すると記載されています。
両チップの具体的なモデルについては言及されていない。
※ 画像をクリックすると別Window・タブで拡大します。
GPUについても同様で、NVIDIA GeForce RTX 3060 Tiと同等の性能を1/3の消費電力で、NVIDIAのフラッグシップグラフィックスカードGeForce RTX 3090と同等の性能を、200W少ない電力で実現しています。
Appleも既存のMac ProソリューションでRadeon Pro W6900Xと比較した数値を示しました。
M1 Ultra SOCを搭載したMac Studioは、Radeon Proソリューションよりも最大で80%高速なパフォーマンスを発揮します。
※ 画像をクリックすると別Window・タブで拡大します。
M1 Ultra搭載によってMac Studioが実現すること
- 10コアプロセッサを搭載した最速の27インチiMacと比べて最大3.8倍高速なCPUパフォーマンス。
- 16コアXeonプロセッサを搭載したMac Proと比べて最大90パーセント高速なCPUパフォーマンス。
- 28コアMac Proより最大60パーセント高速なCPUパフォーマンス。
- 27インチiMacと比べて最大4.5倍、現在市販されている最速のMacグラフィックカードと比べて最大80パーセント高速なグラフィックパフォーマンス。
- ビデオのトランスコード時には、27インチiMacの最大12倍、28コアMac Proの最大5.6倍の速さになります。
Apple M1 Ultra SOC UltraFusion チップ間接続:
※ 画像をクリックすると別Window・タブで拡大します。
脚注
- Apple M1 Ultra、20コアCPU、64コアGPU、128GBのRAM、8TB SSDを搭載した試作Mac Studioシステム、および384GB RAMと32GB GDDR6のAMD Radeon Pro W6900Xグラフィックスを搭載し、Afterburnerと4TB SSDで構成された2.5GHz 28コアの量産Mac Proシステムで2022年2月に実施したテスト結果に基づいています。5K Apple ProRes RAWメディアを使用し、解像度5760×3240、毎秒24フレームの3分間のクリップをApple ProRes 422にトランスコードしたPrerelease Compressor 4.6.1のテスト結果。性能テストは特定のコンピュータシステムで実施され、Mac StudioとMac Proのおおよその性能を反映しています。
- テストは、Apple M1 Max、10コアCPU、32コアGPUを搭載した試作Mac Studioシステム、およびApple M1 Ultra、20コアCPU、64コアGPUを搭載した試作Mac Studioシステムを使用して、2022年2月にAppleにより実施されました。性能は厳選された業界標準のベンチマークを使用して測定しています。10コアPCデスクトップCPUの性能データは、Core i5-12600KとDDR5メモリでテストしたものです。16コアPCデスクトップCPUのパフォーマンスデータは、Core i9-12900KおよびDDR5メモリでテストされています。性能テストは特定のコンピュータシステムで実施したものであり、Mac Studioのおおよその性能を反映しています。
- テストは、Apple M1 Max、10コアCPU、32コアGPUを搭載した量産型Mac Studioシステム、およびApple M1 Ultra、20コアCPU、64コアGPUを搭載した量産型Mac Studioシステムを使用して、2022年2月にAppleが実施したものです。性能の測定には、厳選された業界標準のベンチマークを使用しました。DDR5メモリを搭載したCore i9-12900KとGeForce RTX 3060 Tiを使用した一般的なディスクリートGPUの性能データをテストしました。Core i9-12900K、DDR5メモリ、GeForce RTX 3090でテストした最高級ディスクリートGPUのパフォーマンスデータです。性能テストは特定のコンピュータシステムを使用して実施され、Mac Studioのおおよその性能を反映しています。
- テストは、Apple M1 Ultra、20コアCPUと64コアGPU、128GBのRAMを搭載し、8TB SSDで構成された量産前のMac Studioシステムを使用して、2022年2月にAppleが実施したものです。プレリリース版Final Cut Pro 10.6.2は、解像度8192×4320、毎秒30フレームのApple ProRes 422ビデオを18ストリーム使用した1分間のピクチャーインピクチャープロジェクトと、解像度8192×4320、毎秒30フレームのApple ProRes 422ビデオを9ストリーム使用した1分間のピクチャーインピクチャープロジェクトを用いてテストされました。性能テストは特定のコンピュータシステムを使用して実施され、Mac Studioのおおよその性能を反映しています。
- 20コアCPUと64コアGPUを搭載したApple M1 Ultraを搭載したプリプロダクションMac Studioシステムを使用し、2022年2月にAppleが実施したテストです。消費電力は、商用アプリケーションの代表的なワークロードを使用して測定されました。ハイエンドPCのデスクトップデータは、Core i9-12900KFとGeForce RTX 3090を搭載したAlienware Aurora R13のテストから取得したものです。パフォーマンステストは、特定のコンピュータシステムを使用して実施され、Mac Studioのおおよそのパフォーマンスを反映しています。
解説:
Intel AlderLakeに対するAppleからの強烈なメッセージ
M1 Ultraの性能を見てびっくりです。
- CPUはPコア16コア、Eコア4コアの合計20コア、AlderLakeと同じ消費電力で+90%、つまり約2倍の性能、-100Wで同等の性能
- GPUはRTX3060と同じ性能を1/3の消費電力で、RTX3090と同じ性能を-200W(RTX3090は350Wなので、つまり150W)で実現する
ただ、こういう書き方をするからにはちゃんと実機に搭載して稼働した時に、どこか及ばないところがあるのでしょう。
こういうわかりにくい書き方ではなく、ちゃんと実機に搭載した状態で、クロスプラットフォーム対応のベンチマークを走らせてほしかったところです。
しかし、2個のチップを接続して、これだけのSoCを作り上げるのには脱帽ですね。
サーバー用のM1シリーズは当面出てこないと思っていたのですが、ひょっとしたらもうすぐ出るのかもと思わせるような怪物チップです。
実機の消費電力がどのくらいになるのかはわかりませんが、内臓GPU一体型のCPU(SoC)としては破格の性能になるのではないかと思います。
Intelは製造プロセスをリブランドして、ロードマップを更新し、それまでのFabの技術革新の遅延による不調から立ち直りましたが、ロードマップの隅々にかなりAppleを意識した表現が使われていました。
今回のM1 Ultraは比較対象に16コアCPUとだけ書いてありますが、もちろんAlderLakeのことでしょう。
AppleからもIntelに強烈な挑戦状がたたきつけられた形です。
IntelはTSMCのN3を抑えたという噂が飛んでいましたが、あくまでもAppleが抑えた後の分に関してでしょう。
もし仮にIntelがTSMCのN3のAppleが抑えた後の余力を全部抑えたのだとしたら、同等の製造プロセスを使うAppleの製品しかIntelには対抗できないことになります。
AppleがN3を使った時の可能性と言うものはこのM1 Ultraから十分垣間見ることができます。