AMD Radeon RX 7900 XT フラッグシップ RDNA 3 グラフィックスカードはほぼ 100 TFLOPs を達成可能、Navi 31 GPU 周波数は 3 GHz を超える勢い

AMD Radeon RX 7900 XTは、Greymon55からの最新の噂では、全く異なるRDNA 3「Navi 31」GPU搭載の獣であることが判明しています。

このリーカーは、新しい情報に基づいて、AMDが以前の予想よりもはるかに強力な設計を作成したことを報告しています。

RDNA 3「Navi31」GPU搭載のフラッグシップグラフィックスカード「AMD Radeon RX 7900 XT」は、3GHz以上のクロックスピードと約100TFLOPsのパフォーマンスを提供する可能性がある。

ここ数日、AMD RDNA 3 (GFX11) GPUの目撃情報がいくつかあり、Linux OSのドライバと開発ツール内のLLVMプロジェクトに登場し始めています。

AMDは少なくとも4つの新しいGPUに取り組んでいるようで、以下のようなIDリークによって確認されています（ソース: @Kepler_L2）。

GFX (1100) – Navi 31 GPUの可能性あり
GFX (1101) – Navi 32 GPUの可能性あり
GFX (1102) – Navi 33 GPUの可能性あり
(GFX 1103) – Phoenix APUの可能性あり

これらのIDは、スペックや構成といった多くの情報を明らかにしていませんが、予備的なサポートが追加され、間もなくこれらのGPUがそれぞれのプラットフォーム内でテストを開始し、最適化されたパフォーマンスを提供することを教えてくれています。

しかし、このトピックはリークされたIDについてではなく、Radeon RX 7900シリーズカードを搭載する予定のフラッグシップRDNA 3 GPU、Navi 31にまつわる最新の噂についてである。

※　画像をクリックすると別Window・タブで拡大します。

Greymon55の最新の噂によると、クロックスピードは2.5GHzから大きく向上し、現在では3GHzの周波数マークとほぼ同じかそれ以上になっているようです。

これは、15360ストリームプロセッサを搭載したフラッグシップチップが、ほぼ100.0TFLOPsのFP32演算性能（正確には92TFLOPs）を実現できることを意味します。これは、すでに迫っている100TFLOPsの壁に近づくためのOC制限を加えない場合です。

https://twitter.com/greymon55/status/1520392877242675201?ref_src=twsrc%5Etfw

https://twitter.com/greymon55/status/1520392355588628487?ref_src=twsrc%5Etfw

しかし、NVIDIAがGeForce RTX 40シリーズ向けにAda Lovelace GPUアーキテクチャを大幅に変更するという最近の報道も考慮されたようで、リーク者は、Ada Lovelaceフラッグシップが100 TFLOPs GPU Computeバリアを初めて突破するだけではなく、AMD RDNA 3と同様のクロックレートを達成すると予想しており、これはSamsungの8nmからTSMCのbleding-edge 4Nノードに変更したお陰かもしれないと述べています。

これは、Samsungの8nmから、TSMCのN5プロセス(5nm)をベースに最適化した4Nノードに切り替えたためと思われます。

Radeon RX 7900シリーズ向けGPU「AMD RDNA 3 Navi 31」について

RDNA 3のフラッグシップチップであるAMD Navi 31 GPUは、Radeon RX 7900 XTグラフィックスカードのような次世代エンスージアストカードを駆動することになる。

AMDは、次世代RDNA 3 GPUでは、CU(Compute Units)をやめて、WGP(Work Group Processors)を採用すると聞いている。

各WGPは、デュアルCU(Compute Units)を搭載するが、RDNA 2では各CUに2つしかなかったSIMD32クラスタが2倍になる。

https://twitter.com/Kepler_L2/status/1520256804298629124?ref_src=twsrc%5Etfw

今回紹介するNavi 31のGPU構成は、2つのGCD(Graphics Core Die)と1つのMCD(Multi-Cache Die)を搭載している。

各GCDは3基のShader Engine(合計6基)を持ち、各Shader Engineは2基のShader Array(SEあたり2基/GCDあたり6基/合計12基)を持つ。

各Shader Arrayは5つのWGP(SEあたり10個/GCDあたり30個/合計60個)で構成され、各WGPには32個のALUを持つSIMD32ユニット(SAあたり40個/SEあたり80個/GCDあたり240個/合計480個)を8個搭載する。

これらのSIMD32ユニットを組み合わせ、1GCDあたり7,680コア、合計15,360コアを構成しています。

※　画像をクリックすると別Window・タブで拡大します。

Navi31（RDNA 3）のMCDは、次世代インターコネクト「Infinity Fabric」でデュアルGCDにリンクされ、256～512MBのInfinity Cacheを搭載する予定だ。

また、各GPUは、4本のメモリコネクトリンク(32-bit)を搭載するはずだ。つまり、合計8個の32-bitメモリコントローラで、256-bitのバスインターフェイスを実現する。

また、フラッグシップGPUのNavi 31には3D Stackingの噂もあり、発売は今のところ2022年第4四半期後半とされているが、ペーパーローンチで実際の入手は2023年第1四半期からという可能性もありそうだ。

AMD、Intel、NVIDIAの次期フラッグシップGPUのスペック（暫定版）

GPU名	AD102	Navi 31	Xe2-HPG
コードネーム	Ada Lovelace	RDNA 3	Battlemage
フラッグシップ	GeForce RTX 4090シリーズ	Radeon RX 7900 シリーズ	Arc B900 シリーズ
製造プロセス	TSMC 4N	TSMC 5nm+ TSMC 6nm	TSCM 5nm?
GPUパッケージ	モノリシック	MCD (マルチ・チップレット・ダイ)	MCM (マルチ・チップレット・モジュール)
GPUダイ	Mono x 1	2 x GCD + 4 x MCD + 1 x IOD	4タイル (tGPU)
GPUメガクラスタ	12 GPCs (グラフィック処理クラスタ)	6シェーダーエンジン	10レンダースライス
GPUスーパークラスター	72 TPC (テクスチャ処理クラスタ)	30 WGPs ( MCD毎) 60 WGPs (合計)	40 Xe-Cores (Tile毎) 160 Xe-コア (合計)
GPU クラスター	144 ストリームマルチプロセッサー (SM)	120 コンピュートユニット(CU) 240 コンピュートユニット (合計)	1280 Xe VE (Tile毎) 5120 Xe VE (合計)
コア数(ダイ毎)	18432 CUDA コア数	7680 SP ( GCD毎) 15360 SP (合計)	20480 ALUs (合計)
ピーククロック	~2.85 GHz	~3.0 GHz	不明
FP32演算性能	~105 TFLOPs	~92 TFLOPs	不明
メモリタイプ	GDDR6X	GDDR6	GDDR6?
メモリ容量	24 GB	32 GB	不明
メモリバス幅	384-bit	256-bit	不明
メモリ速度	~21 Gbps	~18 Gbps	不明
キャッシュサブシステム	96 MB L2 Cache	512 MB (Infinity Cache)	不明
TBP	~600W	~500W	不明
発売時期	2022Q4	2022Q4	2023

ソース：wccftech – AMD Radeon RX 7900 XT Flagship RDNA 3 Graphics Card Could Reach Almost 100 TFLOPs, Navi 31 GPU Frequency Hitting Over 3 GHz

解説：

嘘かホントか・RDNA3 RX7900XTは100TFLOPs

RDNA2はインフィニティキャッシュを搭載し、ゲーム性能が非常に高くなったことは周知の事実だと思います。

反面、FP32演算性能はさほどでもなく、例えば、RX6900XTは23..04TFLOPSに対して、同クラスのGeforce RTX3080Tiは34TFLOPSとかなり性能に開きがありました。

ゲーマーにとっては別に関係ないのですが、演算性能がモロに影響する分野、レンダリングやエンコードなどはAmpereのミドルレンジ相当の性能しかありませんでした。

これは恐らく、FP32演算性能が低いことが主な理由だと思います。

しかし、RX7900XTではこの弱点が解消される見込みです。

3GHz時で100TFLOPSですから、実にRTX3080Tiの公称値の3倍近い性能を持っていることになります。

レンダリングはちょっとマイナーなレンダリングソフトはGeforceのみの対応となっている場合もあり、なかなか厳しいところもありますが、少なくともソフト側がRadeonに対応してくれれば、Geforceに劣らない性能が期待できるということになります。

RDNA3はインフィニティキャッシュ、MCMと新しい技術を満載し、RTX4000シリーズも後追いで64bitバス当り16MBのインフィニティキャッシュによく似た大容量キャッシュを搭載します。

これによって、単体GPUは新しい次元の性能に突入することはほぼ間違いないと思います。

Geforceは下位モデルとのメモリ容量のギャップ(RTX3060のほうが上位モデルよりメモリが多い)に苦しんできましたが、AMDはRDNA2でインフィニティキャッシュを搭載することによってその問題を解決しましたので、nVidiaもこのメモリ容量ギャップに苦しむことは無くなると思われます。

あとはMCMですが、DLSSなどのソフトがらみはnVidiaが先行し、製造に関することはAMDが先に採用して、nVidiaが後追いするというパターンになっています。

よってMCMも次々世代(RTX5000シリーズ)でnVidiaが採用してくる可能性が高いのかなと思います。

AMDが製造技術で先行出来るのは恐らく製造ボリュームが小さいことと、GPUが一部門に過ぎずに比較的冒険しやすいからなのでしょうが、なかなか面白い関係です。