AMD Radeon RX 7900 XTは、Greymon55からの最新の噂では、全く異なるRDNA 3「Navi 31」GPU搭載の獣であることが判明しています。
このリーカーは、新しい情報に基づいて、AMDが以前の予想よりもはるかに強力な設計を作成したことを報告しています。
RDNA 3「Navi31」GPU搭載のフラッグシップグラフィックスカード「AMD Radeon RX 7900 XT」は、3GHz以上のクロックスピードと約100TFLOPsのパフォーマンスを提供する可能性がある。
ここ数日、AMD RDNA 3 (GFX11) GPUの目撃情報がいくつかあり、Linux OSのドライバと開発ツール内のLLVMプロジェクトに登場し始めています。
AMDは少なくとも4つの新しいGPUに取り組んでいるようで、以下のようなIDリークによって確認されています(ソース: @Kepler_L2)。
- GFX (1100) – Navi 31 GPUの可能性あり
- GFX (1101) – Navi 32 GPUの可能性あり
- GFX (1102) – Navi 33 GPUの可能性あり
- (GFX 1103) – Phoenix APUの可能性あり
これらのIDは、スペックや構成といった多くの情報を明らかにしていませんが、予備的なサポートが追加され、間もなくこれらのGPUがそれぞれのプラットフォーム内でテストを開始し、最適化されたパフォーマンスを提供することを教えてくれています。
しかし、このトピックはリークされたIDについてではなく、Radeon RX 7900シリーズカードを搭載する予定のフラッグシップRDNA 3 GPU、Navi 31にまつわる最新の噂についてである。
※ 画像をクリックすると別Window・タブで拡大します。
Greymon55の最新の噂によると、クロックスピードは2.5GHzから大きく向上し、現在では3GHzの周波数マークとほぼ同じかそれ以上になっているようです。
これは、15360ストリームプロセッサを搭載したフラッグシップチップが、ほぼ100.0TFLOPsのFP32演算性能(正確には92TFLOPs)を実現できることを意味します。これは、すでに迫っている100TFLOPsの壁に近づくためのOC制限を加えない場合です。
https://twitter.com/greymon55/status/1520392877242675201?ref_src=twsrc%5Etfw
https://twitter.com/greymon55/status/1520392355588628487?ref_src=twsrc%5Etfw
しかし、NVIDIAがGeForce RTX 40シリーズ向けにAda Lovelace GPUアーキテクチャを大幅に変更するという最近の報道も考慮されたようで、リーク者は、Ada Lovelaceフラッグシップが100 TFLOPs GPU Computeバリアを初めて突破するだけではなく、AMD RDNA 3と同様のクロックレートを達成すると予想しており、これはSamsungの8nmからTSMCのbleding-edge 4Nノードに変更したお陰かもしれないと述べています。
これは、Samsungの8nmから、TSMCのN5プロセス(5nm)をベースに最適化した4Nノードに切り替えたためと思われます。
Radeon RX 7900シリーズ向けGPU「AMD RDNA 3 Navi 31」について
RDNA 3のフラッグシップチップであるAMD Navi 31 GPUは、Radeon RX 7900 XTグラフィックスカードのような次世代エンスージアストカードを駆動することになる。
AMDは、次世代RDNA 3 GPUでは、CU(Compute Units)をやめて、WGP(Work Group Processors)を採用すると聞いている。
各WGPは、デュアルCU(Compute Units)を搭載するが、RDNA 2では各CUに2つしかなかったSIMD32クラスタが2倍になる。
https://twitter.com/Kepler_L2/status/1520256804298629124?ref_src=twsrc%5Etfw
今回紹介するNavi 31のGPU構成は、2つのGCD(Graphics Core Die)と1つのMCD(Multi-Cache Die)を搭載している。
各GCDは3基のShader Engine(合計6基)を持ち、各Shader Engineは2基のShader Array(SEあたり2基/GCDあたり6基/合計12基)を持つ。
各Shader Arrayは5つのWGP(SEあたり10個/GCDあたり30個/合計60個)で構成され、各WGPには32個のALUを持つSIMD32ユニット(SAあたり40個/SEあたり80個/GCDあたり240個/合計480個)を8個搭載する。
これらのSIMD32ユニットを組み合わせ、1GCDあたり7,680コア、合計15,360コアを構成しています。
※ 画像をクリックすると別Window・タブで拡大します。
Navi31(RDNA 3)のMCDは、次世代インターコネクト「Infinity Fabric」でデュアルGCDにリンクされ、256~512MBのInfinity Cacheを搭載する予定だ。
また、各GPUは、4本のメモリコネクトリンク(32-bit)を搭載するはずだ。つまり、合計8個の32-bitメモリコントローラで、256-bitのバスインターフェイスを実現する。
また、フラッグシップGPUのNavi 31には3D Stackingの噂もあり、発売は今のところ2022年第4四半期後半とされているが、ペーパーローンチで実際の入手は2023年第1四半期からという可能性もありそうだ。
AMD、Intel、NVIDIAの次期フラッグシップGPUのスペック(暫定版)
GPU名 | AD102 | Navi 31 | Xe2-HPG |
コードネーム | Ada Lovelace | RDNA 3 | Battlemage |
フラッグシップ | GeForce RTX 4090シリーズ |
Radeon RX 7900 シリーズ |
Arc B900 シリーズ |
製造プロセス | TSMC 4N | TSMC 5nm+ TSMC 6nm | TSCM 5nm? |
GPUパッケージ | モノリシック | MCD (マルチ・ チップレット・ダイ) |
MCM (マルチ・ チップレット・モジュール) |
GPUダイ | Mono x 1 | 2 x GCD + 4 x MCD + 1 x IOD |
4タイル (tGPU) |
GPUメガ クラスタ |
12 GPCs (グラフィック 処理クラスタ) |
6シェーダー エンジン |
10レンダー スライス |
GPUスーパー クラスター |
72 TPC (テクスチャ 処理クラスタ) |
30 WGPs ( MCD毎) 60 WGPs (合計) |
40 Xe-Cores (Tile毎) 160 Xe-コア (合計) |
GPU クラスター |
144 ストリーム マルチプロセッサー (SM) |
120 コンピュート ユニット(CU) 240 コンピュート ユニット (合計) |
1280 Xe VE (Tile毎) 5120 Xe VE (合計) |
コア数(ダイ毎) | 18432 CUDA コア数 |
7680 SP ( GCD毎) 15360 SP (合計) |
20480 ALUs (合計) |
ピーク クロック |
~2.85 GHz | ~3.0 GHz | 不明 |
FP32演算性能 | ~105 TFLOPs | ~92 TFLOPs | 不明 |
メモリタイプ | GDDR6X | GDDR6 | GDDR6? |
メモリ容量 | 24 GB | 32 GB | 不明 |
メモリバス幅 | 384-bit | 256-bit | 不明 |
メモリ速度 | ~21 Gbps | ~18 Gbps | 不明 |
キャッシュ サブシステム |
96 MB L2 Cache | 512 MB (Infinity Cache) | 不明 |
TBP | ~600W | ~500W | 不明 |
発売時期 | 2022Q4 | 2022Q4 | 2023 |
解説:
嘘かホントか・RDNA3 RX7900XTは100TFLOPs
RDNA2はインフィニティキャッシュを搭載し、ゲーム性能が非常に高くなったことは周知の事実だと思います。
反面、FP32演算性能はさほどでもなく、例えば、RX6900XTは23..04TFLOPSに対して、同クラスのGeforce RTX3080Tiは34TFLOPSとかなり性能に開きがありました。
ゲーマーにとっては別に関係ないのですが、演算性能がモロに影響する分野、レンダリングやエンコードなどはAmpereのミドルレンジ相当の性能しかありませんでした。
これは恐らく、FP32演算性能が低いことが主な理由だと思います。
しかし、RX7900XTではこの弱点が解消される見込みです。
3GHz時で100TFLOPSですから、実にRTX3080Tiの公称値の3倍近い性能を持っていることになります。
レンダリングはちょっとマイナーなレンダリングソフトはGeforceのみの対応となっている場合もあり、なかなか厳しいところもありますが、少なくともソフト側がRadeonに対応してくれれば、Geforceに劣らない性能が期待できるということになります。
RDNA3はインフィニティキャッシュ、MCMと新しい技術を満載し、RTX4000シリーズも後追いで64bitバス当り16MBのインフィニティキャッシュによく似た大容量キャッシュを搭載します。
これによって、単体GPUは新しい次元の性能に突入することはほぼ間違いないと思います。
Geforceは下位モデルとのメモリ容量のギャップ(RTX3060のほうが上位モデルよりメモリが多い)に苦しんできましたが、AMDはRDNA2でインフィニティキャッシュを搭載することによってその問題を解決しましたので、nVidiaもこのメモリ容量ギャップに苦しむことは無くなると思われます。
あとはMCMですが、DLSSなどのソフトがらみはnVidiaが先行し、製造に関することはAMDが先に採用して、nVidiaが後追いするというパターンになっています。
よってMCMも次々世代(RTX5000シリーズ)でnVidiaが採用してくる可能性が高いのかなと思います。
AMDが製造技術で先行出来るのは恐らく製造ボリュームが小さいことと、GPUが一部門に過ぎずに比較的冒険しやすいからなのでしょうが、なかなか面白い関係です。