インテルは、初のArc Alchemist A-Series GPUである最大32個のACM-G10と最大8個のXeコアを搭載したACM-G11を正式に発表しました。
インテル初のディスクリートゲーミングGPUを発表。ACM-G10 32 XeおよびACM-G11 8 Xeを搭載したArc Aシリーズを発表
インテル ARC Alchemist GPUは、主にデスクトップおよびノートブック・プラットフォーム向けに設計されています。現在集まっている情報では、ラインナップは2つのGPUで構成され、それぞれに様々なSKUが用意され、デスクトップ用グラフィックスカードやモビリティGPUの様々なソリューションに搭載される予定だそうです。
※ 画像をクリックすると、別Window・タブで拡大します。
すべてのIntel ARC Alchemist GPUは、TSMC 6nmプロセスノードを利用し、すでに分かっているところでは、Intel Xe-HPG Alchemist GPUは、第1世代ARCラインアップの基本DNAであるXe-Coreを搭載していることである。
Xe-Coreは、16個のVector Engines(256-bit/エンジン)と16個のMatrix Engines(1024-bit/エンジン)からなるコンピュートブロックである。
※ 画像をクリックすると、別Window・タブで拡大します。
各ベクトルエンジンは8個のALUで構成されており、Xe-Core 1台あたり合計128個のALUを搭載していることになります。
Xe-Coreはさらに、専用の192KBのL1キャッシュを搭載しており、チップ全体で合計6MBのL1キャッシュを搭載していることになる。
※ 画像をクリックすると、別Window・タブで拡大します。
Intelは、4つのXe-Coreを融合して、4つのRay Tracing Unit、4つのSampler Unit、Geometry/Rasterize/HiZエンジン、そしてそれぞれに8ユニット搭載した2つのPixel BackendブロックからなるRender Sliceを形成しています。
これらのRender Sliceをまとめて、メインGPUを構成しています。フラッグシップは、8 Render Slice構成で、32 Xe-Core、512 Vector Engines、4096 ALUを搭載している。
2、4、6 Render Slicesの構成もあるが、今回はフラッグシップの部分にフォーカスしてレポートする。
※ 画像をクリックすると、別Window・タブで拡大します。
IntelのXe HPGアーキテクチャは、Xe LPの1.5倍のクロックレートを実現し、ワットあたりの性能も1.5倍向上させる予定です。
これは、Xe LPのディスクリートGPUのクロックが1.4GHzであったことを考えると、2.1GHz台のクロックが期待できることを意味する。
また、Intelは、消費電力を増やさずに(あるいは性能を一定に保ったまま消費電力を減らして)、このアーキテクチャからさらに電力を引き出すことができるようになることを意味する。
※ 画像をクリックすると、別Window・タブで拡大します。
2つのGPUのうち、最初の1つはACM-G10と呼ばれるものになる予定です。
これはトップSKUで、メインストリームおよびハイエンドのデザインに搭載される予定です。
2つ目のGPUは、ACM-G11として知られています。
これはエントリーレベルのSKUで、エントリーレベルおよびメインストリームの設計に採用される予定です。
各GPUには、それぞれ異なる仕様のSKUがあります。
※ 画像をクリックすると、別Window・タブで拡大します。
各マトリックスエンジンブロックはXMXブロックとも呼ばれ、FP16(128 FP16演算/クロック)、INT8(256 INT8演算/クロック)、INT4(512 INT4/INT2演算/クロック)モードの両方でTensor演算を扱います。
XMXエンジンは、INT8推論において最大16倍の計算能力を可能にします。
これにより、専用のXeSS(Xe Super Sampling)技術による性能アップを実現しています。
※ 画像をクリックすると、別Window・タブで拡大します。
メディアエンジンについては、Intel Arc Alchemist ディスクリート GPU は、最大 8K60 12-bit HDR デコード、最大 8K 10-bit HDR エンコード、VP9、AVC、HEVC、AV1 などの最新技術を搭載しています。
インテルは、Alliance for Open Mediaを通じて、Arc GPUのAV1機能を活用するために、トップブランドと提携しています。
新しいAV1エンジンは、ソフトウェアモードに対して50倍高速なGPUエンコーディング機能を提供します。
この技術は、FFMPEG、Handbrake、Adobe Premiere Pro、DaVinci Resolve、XSplitなどの制作ツールに統合され、発売される予定です。
※ 画像をクリックすると、別Window・タブで拡大します。
さらに、Intel Arc Xe Display Engineは、HDMI 2.0b, DisplayPort 1.4a, 2.0 10Gといった最新のディスプレイ規格に対応します。
また、高解像度、高リフレッシュレートの様々なモードをサポートする予定です。
- 2x 8k60 HDR
- 4x 4k120 HDR
- 1080p360
- 1440p360
※ 画像をクリックすると、別Window・タブで拡大します。
アダプティブ・シンク技術については、インテルのディスクリートGPU「Arc Alchemist」がアダプティブ・シンク技術とスピードシンク技術の両方に対応する予定です。
前者はディスプレイのリフレッシュレートを同期させ、ティアリングのない滑らかな体験を、後者は最新のフレームを高速化し、低遅延、ティアリングなし、キャップなしを実現する。
また、「Smooth Sync」と呼ばれる3つ目のモードでは、ディザリングフィルターにより、気になる画面の裂け目をぼかすことができます。
※ 画像をクリックすると、別Window・タブで拡大します。
Intel Xe-HPGベースのディスクリートAlchemist GPUの構成:
GPUモデル | グラフィック カードモデル | GPUダイ | 実行ユニット数 | Shading ユニット数 (コア数) | メモリ容量 ・種類 | メモリ速度 | メモリバス幅 | TGP |
Xe-HPG 512EU | ARC A780? | Arc ACM-G10 | 512 EU | 4096 | 最大32/16 GB GDDR6 | 18 / 16 / 14 Gbps | 256-bit | ~225W (Desktop) 120-150W (NotePC) |
Xe-HPG 384EU | ARC A750? | Arc ACM-G10 | 384 EU | 3072 | 最大12 GB GDDR6 | 16 / 14 Gbps | 192-bit | 150-200W (Desktop) 80-120W (NotePC) |
Xe-HPG 256EU | ARC A580? | Arc ACM-G10 | 256 EU | 2048 | 最大8 GB GDDR6 | 16 / 14 Gbps | 128-bit | 60-80W (NotePC) |
Xe-HPG 128EU | ARC A380? | Arc ACM-G11 | 128 EU | 1024 | 最大6 GB GDDR6 | 16 / 14 Gbps | 96-bit | ~75W (Desktop) |
Xe-HPG 128EU | ARC A350? | Arc ACM-G11 | 128 EU | 1024 | 最大4 GB GDDR6 | 16 / 14 Gbps | 64-bit | 35-50W (NotePC) |
Xe-HPG 96EU | ARC A330? | Arc ACM-G11 | 86 EU | 768 | 最大4 GB GDDR6 | 16 / 14 Gbps | 64-bit | ~35W (NotePC) |
インテル Arc Alchemist「ACM-G10」GPU仕様 - 上位GPUの場合
Arc Alchemist GPUの最上位機種はACM-G10となる予定です。
大きさは407mm2で、NVIDIAのGA014やAMDのNavi 22よりも大きいそうです。
ACM-G10を搭載したGPUは、NVIDIAのGeForce RTX 3070(Ti)やAMD Radeon RX 6700 XTと競合する予定だそうだ。
NVIDIAは、Tensorコアと非常に大きなRT/FP32コアをチップに詰め込み、AMD RDNA 2チップは、CUごとに1つのレイ・アクセラレータ・ユニットとInfinity Cacheを詰め込んでいます。
また、Intelは、レイトレーシング&AIアシストスーパーサンプリング技術用のAlchemist GPUを専用ハードウェアとしてオンボードで搭載する。
フルダイは、32 Xeコア、512 EU、4096 ALU、256-bitバスインターフェイス、最大16GB GDDR6メモリを搭載し、クロックスピードは16~18GbpsのSamsung製を採用する。以下は、ACM-G10 32 EUのバリエーションです。
- 512 EU (4096 ALU) / 16 GB @ Up To 18 Gbps / 256-bit
- 384 EU (3072 ALU) / 12 GB @ 最大16 Gbps / 192ビット
- 256 EU (2048 ALU) / 8 GB @ 最大16 Gbps / 128ビット
Xe-HPG Alchemist ACM-G10チップのクロックは約2.2~2.5GHzとされていますが、これが平均クロックなのか最大ブーストクロックなのかは不明です。
すでに、DG2-512 GPUが2.4 GHzで動作し、20 TFLOPs近いFP32馬力を発揮するフラッグシップ構成が確認されているので、最終リビジョンでは2.5 GHzクロックになる可能性は十分にあります。
これらのチップのTDPターゲットは、ラップトップ用の120Wから始まり、デスクトップ用では300Wまで上がるようです。
いずれの場合も、最終モデルは8+6ピンコネクタ構成になると予想されます。
リファレンスモデルは、IntelがARCブランドの発表時に公開したドローンマーケティングショットに非常によく似た外観になる予定です。
インテルARC AGM-10とNVIDIA GA104 & AMD Navi 22 GPUの比較:
グラフィック カード名 | Intel ARC A350? | NVIDIA GeForce RTX 2050 | AMD Radeon RX 6500 XT | Intel ARC A380? | NVIDIA GeForce RTX 3050 |
GPU名 | ACM-G11 | NVIDIA GA107 | AMD Navi 24 | ACM-G11 | NVIDIA GA106 |
アーキテクチャー | Xe-HPG | Ampere | RDNA 2 | Xe-HPG | Ampere |
製造プロセス | TSMC 6nm | Samsung 8nm | TSMC 7nm | TSMC 6nm | Samsung 8nm |
ダイサイズ | ~155mm2 | 不明 | 不明 | ~155mm2 | 276mm2 |
FP32演算 コア数 | 8 Xe Cores | 16 SM Units | 16 Compute Units | 8 Xe Cores | 24 SM Units |
FP32演算 ユニット数 | 1,024 | 2,048 | 1,024 | 1,024 | 3,072 |
メモリバス幅 | 64-bit | 64-bit | 64-bit | 96-bit | 128-bit |
メモリ容量 ・種類 | 4 GB GDDR6 | 4 GB GDDR6 | 4 GB GDDR6 | 6 GB GDDR6 | 8 GB GDDR6 |
TDP | 35-50W | 30-45W | ~75W | ~75W | ~75W |
発売時期 | 2022Q2 | 2022Q1 | 2022Q2 | 2022Q2 | 2022Q1 |
解説:
第一世代のデスクトップ向けゲーミングGPU、ARC Alchemistがロンチ
まあ、まず、「時期が遅い」これが全てです。
最上位モデルでRTX3070Ti程度の性能と言うのは、RTX4000シリーズが9月に出るということを考えると厳しいです。
TensorコアのようなAIアクセラレーター搭載、レイトレーシングアクセラレーターも搭載と近代的なGPUに必要なものは全て備えているのはさすがと言えます。
ただし、Intel版DLSSのXeSSにはAIアクセラレーターは必要ないとのことですから、自社のソフトで使う機会があるのかどうかは疑問です。
この辺は自社製品の強みを生かすというよりもXeSSと言う規格を普及させることが優先なのでしょうね。
今までも触れてきましたが、他社製品でも自社のソフト技術を使えるようにするのは共有化戦略で、こちらは典型的な弱者の戦略となります。
これが今のIntel、単体GPUの立ち位置と言うことになるのでしょう。
ただし、Intelは当面の間、毎年アーキテクチャーを更新していくとのことですから、最初の製品が無事にロンチすれば、サイクルを回していけると思います。
マークザッカーバーグ氏の名言で有名ですが、「完璧を目指すより、まず終わらせろ」と言うのがありますが、一つのサイクルを回してしまえば最初はダメでもどんどん改良していけますので、これが最初の製品と言うことを考えるとそれほど悪くないのではないかと思います。
ただし、私は買いませんし、人にも勧められません。
最初の製品は出せただけで御の字、評価の対象になるのは次世代からだと考えておくとよいと思います。
Alchemistが市場からどのような評価を受けるのかわかりませんが、Intelがどのような価格を付けようとも、人気が無ければ「神の見えざる手」によって、価格は下がっていくと思います。
去年の年末商戦に参加できるくらいの時期に出せればまた違った評価を受けたと思いますが、なかなかに厳しい船出になりそうです。