ムーアズ・ロウ・イズ・デッド(Moore's Law is Dead)社より、インテル社のゲーミンググラフィックスカード「ARC Alchemist」に関する新たな情報がリークされました。
今回のリーク情報は、2022年第1四半期に発売されるARCラインアップにおける様々なGPU構成の性能と位置づけについてのものです。
Intel ARC Alchemistゲーミンググラフィックスカードの噂:ハイエンドとエントリーレベルのセグメントを狙う3つのXe-HPG GPUコンフィギュレーション
噂によると、インテルは少なくとも3つの構成のARC Alchemist GPUを用意し、2022年第1四半期に発売するとのことです。
その中には、トップの512 EUダイをベースにした2つの構成と、128 EUダイをベースにした1つの構成が含まれます。
リーク情報によると、さらに多くのGPUコンフィギュレーションが存在しているようですが、これらは将来の製品に採用される可能性があるようです。それでは、最上位の構成から見ていきましょう。
※ 画像をクリックすると別Window・タブで拡大します。
Intel Xe-HPG 512 EU ARC Alchemistグラフィックスカード
Alchemist 512 EUは、4096個のコア、256ビットのバスインターフェース、最大16GBのGDDR6メモリを搭載し、16Gbpsのクロックで動作するフルダイを採用しています。
Alchemist 512 EUチップのサイズは約396mm2で、AMD RDNA 2やNVIDIA Ampereのチップよりも大きいと予想されます。
Alchemist -512 GPUは、37.5mm x 43mmのBGA-2660パッケージで提供されます。NVIDIAのAmpere GA104のサイズは392mm2であり、フラッグシップのAlchemistチップが同等のサイズであるのに対し、Navi 22 GPUのサイズは336mm2と約60mm2少ないことになります。
これはチップの最終的なダイサイズではありませんが、非常に近い値になるはずです。
NVIDIAは、Tensorコアとより大きなRT/FP32コアをチップに搭載し、AMD RDNA 2チップは、CUあたり1つのレイアクセラレータユニットとInfinity Cacheを搭載しています。
また、IntelはAlchemist GPUにレイトレーシングとAI支援のスーパーサンプリング技術のための専用ハードウェアを搭載します。
Xe-HPG Alchemist 512 EUチップのクロックは約2.2~2.5GHzとされていますが、これが平均クロックなのか最大ブーストクロックなのかはわかりません。仮に最大クロックであると仮定すると、このカードは最大18.5TFLOPsのFP32演算を行うことができ、これはRX 6700 XTよりも40%多いが、NVIDIA RTX 3070よりも9%低い。
※ 画像をクリックすると別Window・タブで拡大します。
MLIDでは、性能の推測指標として、FLOPsの性能ではなく、アーキテクチャごとに性能のスケールが異なるため、TFLOPsでの比較は意味がないとしています。このゲーミンググラフィックスカードは、現時点ではRX 6700 XTやRTX 3070よりも高速であると予想されていますが、ドライバースイートの開発が進んでいるため、性能はさらに向上すると予想されています。
また、インテルの当初のTDP目標は225~250Wでしたが、現在は275W程度に引き上げられていると記載されています。
さらにクロックを上げたいのであれば、デュアル8ピンコネクタを備えた300Wのバージョンも期待できます。いずれにしても、最終モデルは8+6ピンのコネクター構成になると予想されます。
このリファレンスモデルは、インテルがARCブランドの発表時に公開したドローンのマーケティングショットによく似ていると思います。
このリファレンスデザインは、しばらく前にMLIDによってリークされました。
また、インテルのAIBパートナーによるカスタムラインナップの話も出ています。
Intel ARC Alchemist 対 NVIDIA GA104 & AMD Navi 22 GPU
GPU名 | Alchemist DG-512 | NVIDIA GA104 | AMD Navi 22 |
アーキテクチャー | Xe-HPG | Ampere | RDNA 2 |
製造プロセス | TSMC 6nm | Samsung 8nm | TSMC 7nm |
フラッグシップ製品 | ARC (未確認) | GeForce RTX 3070 Ti | Radeon RX 6700 XT |
ラスターエンジン数 | 8 | 6 | 2 |
FP32コア数 | 32 Xe Cores | 48 SM Units | 40 Compute Units |
FP32ユニット数 | 4096 | 6144 | 2560 |
FP32演算性能 | ~16 TFLOPs | 21.7 TFLOPs | 12.4 TFLOPs |
TMU数 | 256 | 192 | 160 |
ROP数 | 128 | 96 | 64 |
RTコア数 | 32 RT Units | 48 RT Cores (V2) | 40 RA Units |
Tensorコア数 | 512 XMX Cores | 192 Tensor Cores (V3) | N/A |
Tensor 演算性能 | ~131 TFLOPs FP16 ~262 TOPs INT8 | 87 TFLOPs FP16 174 TOPs INT8 | 25 TFLOPs FP16 50 TOPs INT8 |
L2キャッシュ | 未確認 | 4 MB | 3 MB |
追加キャッシュ | 16 MB スマートキャッシュ? | N/A | 96 MB インフィニティ・キャッシュ |
メモリバス幅 | 256-bit | 256-bit | 192-bit |
メモリ容量・種類 | 16 GB GDDR6 | 8 GB GDDR6X | 16 GB GDDR6 |
発売 | 2022Q1 | 2021Q2 | 2021Q1 |
Intel Xe-HPG 384 EU ARC Alchemistグラフィックスカード
次に、Intel Xe-HPG Alchemist 384 GPUは、512 EUダイの縮小版となります。
384 EUチップは、3072コア、最大12GBのGDDR6メモリ、192ビットのバスインターフェースを備えていますが、256ビットのバスにチューニングすることも可能で、8GBのGDDR6メモリを搭載しています。
また、このカードのTDPは約200Wで、NVIDIA RTX 3060およびRTX 3060 Tiの性能を備えていることが期待されています。
384 EU GPUには、それぞれ16MBのスマートキャッシュが搭載される見込みです。このGPUはかなりカットダウンされたモデルなので、2GHz以上のクロックが見られることになるでしょう。
インテルは、448 EUと256 EUを含む様々なカットダウン構成のトップダイをテストしています。これらの構成を採用したゲーミンググラフィックスカードの発売が予定されているかどうかはわかりませんが、インテルには、市場があればさらに多くのSKUを発売する選択肢があります。
Intel Xe-HPG 128 EU ARC Alchemistグラフィックスカード
そして最後に、Intel Xe-HPG Alchemist 128 EUパーツです。
トップモデルは、1024コア、64ビットバスインターフェース、最大8GB GDDR6メモリを搭載したフルモデルチェンジとなります。
縮小版では、96個または768個のコアと、64ビットバスインターフェースの4GB GDDR6メモリを搭載しています。
また、クロックスピードは2.2〜2.5GHz、消費電力は75W以下となり、エントリークラスのグラフィックカードではコネクターレスとなる予定です。
性能は、GeForce GTX 1650とGTX 1650 SUPERの間に着地すると予想されますが、レイトレーシング機能を搭載しています。
AMDやIntelに比べてIntelが持つ可能性のある大きなアドバンテージは、これらのカードで、現世代のカードでは完全に見捨てられていた250ドル以下の米国市場に参入する可能性があることです。
GeForce RTX 3050シリーズは、これまでノートPC向けにしかリリースされておらず、RTX 3060は329USドルでエントリーレベルのアンペアセグメントにサービスを提供していますが、RX 6600は300USドル前後でAMDのエントリーレベルのソリューションになると予想されています。
このGPUは、DG1 GPUベースのディスクリートSDVボードと非常によく似ていますが、Alchemistは、より改良されたアーキテクチャ設計を採用し、第1世代のXe GPUアーキテクチャよりも確実にパフォーマンスが向上しています。
スペックから見ても、このラインナップはエントリーレベルのデスクトップ用ディスクリート市場に向けたものであることは間違いありません。
Intel Xe-HPG DG2 GPUベースのディスクリートゲーミンググラフィックスカードの仕様:
GPUモデル | GPU SKU | Execution Unit数 | Shading Unit数 (コア数) | メモリ容量 | メモリバス幅 | TGP |
Xe-HPG 512EU | DG2-512EU | 512 EUs | 4096 | 16/8 GB GDDR6 | 256-bit | 225~275W? |
Xe-HPG 384EU | DG2-512EU | 384 EUs | 3072 | 12/6 GB GDDR6 | 192-bit | 225-275W? |
Xe-HPG 256EU | DG2-512EU | 256 EUs | 2048 | 8/4 GB GDDR6 | 128-bit | 150-200W? |
Xe-HPG 192EU | DG2-512EU | 192 EUs | 1536 | 4 GB GDDR6 | 128-bit | 150-200W? |
Xe-HPG 128EU | DG2-128EU | 128 EUs | 1024 | 4 GB GDDR6 | 64-bit | 不明 |
Xe-HPG 96EU | DG2-128EU | 86 EUs | 768 | 4 GB GDDR6 | 64-bit | 不明 |
このスケジュールによると、Xe-HPG Alchemistのラインアップは、NVIDIAのAmpereおよびAMDのRDNA 2 GPUと競合することになりますが、両社とも2022年末までに次世代製品を発表する予定はないためです。
NVIDIAとAMDは2022年初頭にリフレッシュモデルを発表すると予想されているため、インテルの新ラインアップと競合することになるかもしれませんが、現在の性能期待値からすると、リフレッシュモデルがラインアップに劇的な性能差をもたらすことはないかもしれません」と述べています。
また、Xe-HPG ARC GPUは、モバイルプラットフォームにも搭載され、Alder Lake-PノートPCに搭載される予定です。
解説:
AlchemistのトップモデルはRTX3070Tiに近くなるという話が出ています。
しかし、メモリ帯域幅とFP32演算性能からはじき出した予測理論値を見ると85%程度となっています。
尤も、大量のキャッシュを積んでいるRX6700XTも予想理論値をかなり大きく上回る性能を発揮しています。
AmpereとRDNA2を見れは分かる通り、FP32演算性能とゲーム性能は綺麗に正比例しなくなってきました。
アーキテクチャーによってはかなり予測理論値とは異なる結果になる可能性はあります。
Alchemistは16MBのスマートキャッシュを搭載するとされていますので、RDNA2ほどではなかったとしても多少影響する可能性は高いと思います。
FP32演算性能とメモリ帯域幅だけを見るならば、AlchemistはAmpereに遠く及ばないでしょう。
AmpereがFP32演算性能の割にゲーム性能が低かったので、Alchemistの特性によってはRTX3070Tiを上回る可能性もあるのかなと思います。