Alchemist Xe-HPG GPUを搭載したインテルARCグラフィックスカードは、来年の発売を予定しており、その仕様によれば、AMDやNVIDIAのGPUに対して非常に競争力のある性能を発揮することになりそうだ。
Xe-HPG Alchemist GPUを搭載したインテルのフラッグシップARCグラフィックスカードは、NVIDIA GA104やAMD Navi 22に対して高い競争力を持つことになる。
インテルARCグラフィックスカードは、Xe-HPGアーキテクチャを採用したAlchemist(アルケミスト)GPUを搭載します。
インテルは、最初のグラフィックスカードが2022年第1四半期に発売されることを確認しており、TSMCの6nmプロセスノードを採用します。
また、Alchemist GPUの仕様や、Xe-Coreを含むコア・ビルディング・ブロックについても詳しく説明しています。
Intel ARC Xe-HPG Alchemist GPU - ビルディング・ブロック
※ 画像をクリックすると別Window・タブで拡大します
Intel Xe-HPG Alchemist GPUには、第1世代ARCの基本的なDNAであるXe-Coreが搭載されています。
Xe-Coreは、16個のVector Engine(1個あたり256ビット)と16個のMatrix Engine(1個あたり1024ビット)で構成されるコンピュートブロックです。
各Vector Engineは8個のALUで構成されており、Xe-Coreには合計128個のALUが搭載されていることになります。
各マトリクスエンジンブロックはXMXブロックとも呼ばれ、FP16とINT8の両方のモードでTensor演算を行います。また、Xe-Coreには専用のL1キャッシュが搭載されています。
※ 画像をクリックすると別Window・タブで拡大します
Intelは、4つのXeコアを融合して、4つのRay Tracingユニット、4つのSamplerユニット、Geometry/Rasterize/HiZエンジン、8ユニットずつの2つのPixel Backendブロックで構成されるRender Sliceを形成する。これらのRender SliceをまとめてメインGPUを構成しています。
フラッグシップモデルは、8 Render Slice構成で、32個のXe-Cores、512個のVector Engines、4096個のALUを搭載しています。
2、4、6 Render Sliceの構成もありますが、ここではフラッグシップの部分に焦点を当てます。
※ 画像をクリックすると別Window・タブで拡大します
Intel ARC Alchemist vs NVIDIA GA104 & AMD Navi 22 GPUs
GPU名 | Alchemist DG-512 | NVIDIA GA104 | AMD Navi 22 |
アーキテクチャー | Xe-HPG | Ampere | RDNA 2 |
製造プロセス | TSMC 6nm | Samsung 8nm | TSMC 7nm |
フラッグシップ製品 | ARC (未確認) | GeForce RTX 3070 Ti | Radeon RX 6700 XT |
ラスターエンジン数 | 8 | 6 | 2 |
FP32コア数 | 32 Xe Cores | 48 SM Units | 40 Compute Units |
FP32ユニット数 | 4096 | 6144 | 2560 |
FP32演算性能 | ~16 TFLOPs | 21.7 TFLOPs | 12.4 TFLOPs |
TMU数 | 256 | 192 | 160 |
ROP数 | 128 | 96 | 64 |
RTコア数 | 32 RT Units | 48 RT Cores (V2) | 40 RA Units |
Tensorコア数 | 512 XMX Cores | 192 Tensor Cores (V3) | N/A |
Tensor 演算性能 | ~131 TFLOPs FP16 ~262 TOPs INT8 | 87 TFLOPs FP16 174 TOPs INT8 | 25 TFLOPs FP16 50 TOPs INT8 |
L2キャッシュ | 未確認 | 4 MB | 3 MB |
追加キャッシュ | 16 MB スマートキャッシュ? | N/A | 96 MB インフィニティ・キャッシュ |
メモリバス幅 | 256-bit | 256-bit | 192-bit |
メモリ容量・種類 | 16 GB GDDR6 | 8 GB GDDR6X | 16 GB GDDR6 |
発売 | 2022Q1 | 2021Q2 | 2021Q1 |
インテルARC Xe-HPG Alchemist GPU - NVIDIAのGA104およびAMDのNavi 22との比較
3DCenterでは、Intelの新しいGPUが提供する理論的な性能を知るために、その仕様と比較を行っています。
インテルのフラッグシップモデル「ARC Xe-HPG Alchemist」は、NVIDIAやAMDの競合製品よりも多くのTMUとROPを備えています。
4096というコア数は、AMDのNavi 22、Navi 21(RX 6800)よりは高いが、NVIDIAのGA104と比べると低い。NVIDIAはデュアルFP32というナンバリング方法を採用しており、理論的には3072になるはずだ。
IntelのARC Alchemist GPUは、レイトレーシングユニットが競合製品よりも低いが、レイトレーシングの実装がどのようになっているかは正確にはわからない。
例えば、Navi 22はGA106 Ampere GPUよりも多くのRTコアを提供していますが、NVIDIAのRTコア内のハードウェアレベルの統合は、あらゆる点でAMDの実装よりも優れています。
つまり、最終的なパフォーマンスは、インテルのハードウェアレベルの統合と、レイトレーシングアプリケーションのためのソフトウェアレベルの最適化にかかっているのです。
Intelが競合他社、特にAMDがこの部門で欠けているためにNVIDIAに対して持ちうる大きなリードは、スーパーサンプリング技術におけるAI支援です。
インテルはすでにXeSS技術の印象的なデモを披露しており、予想される数値からすると、インテルのGPUはXMXアーキテクチャを採用したNVIDIAのTensor Core実装(DLSS)を上回る可能性があります。
また、インテル社のGPUには、小さいながらも有用なゲームキャッシュが搭載され、256ビットのバスインターフェースで最大16GB(GDDR6)の大容量VRAMが搭載される見込みです。
これは、NVIDIAのRTX 3070およびRTX 3070 Tiの2倍のメモリとなるため、それに対抗するための新モデルを用意する必要があるかもしれない。
最後に、理論上のFP32演算性能は、予想されるピーククロックレートが2GHzの場合に計算されます。
これは、TSMCの7nmプロセスノードでのクロックのスケーリングを考えると、TSMCの6nmプロセスノードで最も可能性の高いシナリオです。
このことから、Intel Xe-HPG Alchemist GPUは、約16〜17TFLOPsのCompute Powerを提供できると考えられます。
これは、NVIDIAのGA104が生み出すFLOPsよりもわずかに低い値ですが、ゲーム用のアーキテクチャはデータセンター用のチップとは大きく異なるため、すべてのFLOPsを同じように測定すべきではないことに留意する必要があります。
これらの初期仕様に基づくと、最終的にはAMDのRadeon RX 6700 XTやNVIDIAのRTX 3070よりも高速になる可能性があるインテルのグラフィックスカードに注目しています。
インテルは、第1世代のグラフィックスカードをさらにコンシューマーセグメントに押し上げるために、AMDやNVIDIAのような既存の巨人に対して非常に競争力のある価格を提供する可能性があります。
また、ソフトウェアレベルでの強力な最適化を行うことで、将来の世代のARC GPUに向けて前進するWin-Winの関係を手に入れることができるかもしれません。
解説:
wccftechがintel Alchemist GPUのフラッグシップをNavi22とRTX3070/Tiと比較し始める
今まで、Xe-DG2はRTX3080以上の性能になると言われてきましたが、ここにきてwccftechがトーンダウンするかのようなまさかのターゲット変更記事を出しています。
価格がこのくらいになるということなのかもしれませんが、何か残念な感じのする記事です。
最近はFP32の演算性能がリニアにゲーム性能に反映されなくなってしまいましたが、一応DG2のフラッグシップは16-17TFLOPsの演算性能を持つと考えられているようです。
巨大なキャッシュを持つRDNA2の効率には敵わないとしても、AmpereよりはFP32演算性能当たりのゲーム性能が高い可能性は非常に高い(と言うよりほぼそう)でしょう。
フラッグシップの性能が高い方が価格の決定権を持ち、ラインナップ全体のイメージを高め、GPU市場をリードすることができます。
最近のnVidiaはDLSSとRTXと言う2つの技術を他社より2年先行して出すことによって、ブランドイメージをより強固なものにし、絶対王者として君臨するまでに至りました。
Intleはこの絶対王者に勝てるのかどうか?
もしDG2-512がこの記事の通り、RTX3070Ti/Navi22相当の製品であるとするならば、厳しい船出になりそうです。