Twitterユーザーの_WildC氏は、AMDの次期GPU「RDNA 3 “Navi 3X”」の噂に基づいたレンダリングを複数作成しました。
これらのレンダリングは、新しいGPUファミリーについてリークされたり噂されたりしている最新の情報を代表するものです。
また、この新しいアーキテクチャが要求する複雑さについても知ることができます。
AMD RDNA 3「Navi 3x」GPUのレンダリング画像がTwitterに登場、次世代ハードウェアの複雑さを予感させる
現在わかっている情報としては、AMDはNavi 31 GPUのために合計6枚のMCDを作成し、また現在のチップの規模に収まるように製造することを確認した。
また、最新のRadeon RX 7000シリーズグラフィックスカードに搭載されるNavi 3X GPUは、合計3枚に絞られているとのこと。
3つのNavi 3X GPUのうち、2つはGCD(Graphics Core / Compute Die)およびMCD(Memory Complex / Compute Die)ベースのチップレットデザインを採用する見込みです。
RDNA 3アーキテクチャを採用したAMD Navi 33 GPUは、モノリシック設計を採用しており、MCDとGCDを分離する代わりに、1つのチップに多くのものを詰め込む必要があるため、チップレットGPUと比較してダイサイズが大きくなってしまう可能性があります。
https://twitter.com/_wildc/status/1550160180020756480?ref_src=twsrc%5Etfw
Navi 3X GPUのサイズに関する憶測はまだ確認されていない。
それでも、Navi 31 GCDのサイズが変更されたことが予想され、正式な回路図と仕様を受け取るまで、チップデザインがどうなるのか、新たな推定が生み出されています。
TwitterのWild_Cは、現在の情報に基づいていくつかのレンダリングを作成し、ソーシャルプラットフォームでそれを共有しています。
AMD Navi 31は、同社の次世代アーキテクチャ「RDNA 3」を採用した新GPUの始まりです。
このGPUは機能満載で、最大48個のWorkGroup Processorと12,288個のStream Processorを搭載している。
AMDの新しいデザインは、GPUを維持した上で、6つのMCDをサポートすることができ、これはHigh Bandwidth Memoryを搭載したグラフィックスカードと同様の働きをする。
同社のVegaやFijiラインなどの設計と同様に、メモリはGPU自体にはなく、代わりにInfinity Cacheとコントローラで代用される。
設計上、大型化する必要があるため、GCDのダイサイズは370mm²、GPUは630mm²と大きくなることが予想される。
新しいAMD Navi 32は、コアとMCDの数が少ないことを除けば、Navi 31とほぼ同じ設計になっています。
最後に、この新しいGPUは、約 440mm² の大きさの 8,192 個のストリームプロセッサに 32 個もの WGP を提供する予定です。
AMD RDNA 3 Navi 3X GPUの構成(速報):
GPU名 | Navi 21 | Navi 33 | Navi 32 | Navi 31 | Navi 3X |
製造プロセス | 7nm | 6nm | 5nm/6nm | 5nm/6nm | 5nm/6nm |
パッケージ | Monolithic | Monolithic | MCM | MCM | MCM |
シェーダー エンジン数 |
4 | 2 | 4 | 6 | 8 |
GPU WGP数 | 40 | 20-16 | 40-32 | 60-48 | 64 |
WGP毎のSP数 | 128 | 256 | 256 | 256 | 256 |
演算ユニット 数 (ダイ毎) |
80 | 40-32 | 160 -128 (合計) |
240-192 (合計) |
128 (GPU毎) 256(合計) |
コア数 (ダイ毎) |
5120 | 5120-4096 | 10240-8192 | 15360-12288 | 8192 |
コア数 (合計) | 5120 | 5120-4096 | 10240-8192 | 15360-12288 | 16384 |
メモリハス幅 | 256-bit | 128-bit | 256-bit | 384-bit | 384-bit x2? |
メモリタイプ | GDDR6 | GDDR6 | GDDR6 | GDDR6 | GDDR6 |
メモリ容量 | 最大16 GB | 最大8 GB | 最大16 GB | 最大24 GB | 最大32 GB |
インフィニティ キャッシュ |
128 MB | 128 MB | 256 MB | 384 MB | 不明 |
フラッグシップSKU | Radeon RX 6900 XTX |
Radeon RX 7600 XT? |
Radeon RX 7700 XT? |
Radeon RX 7900 XT? |
Radeon Pro |
TBP | 330W | ~200W | ~300W | ~400W | 不明 |
発売時期 | 2020Q4 | 2022Q4? | 2022Q4? | 2022Q4? | 2023? |
解説:
Navi3Xシリーズのユーザーメイドのレンダリング画像が公開される
ユーザーが勝手に作ったレンダリング画像ですが、なかなかわかりやすいイメージです。
ダイサイズは元記事にもある通り、
Navi33 = 20.5 * 19.5 = 400mm²
Navi31/32 MCD = 4.68 * 9.36 = 44mm²
Navi32 GCD = 13.1 * 20.1 = 263mm²
Navi31 GCD = 13.1 * 28.2 = 369mm²
Navi32 Total = 439mm²
Navi31 Total = 633mm²
GCDを一つしか使わないということでしたが、MCDを共通化することによって、
Navi31の合計ダイ面積633mm2とNavi32合計ダイ面積439mm2において、Navi31は264mm2分をNavi32は176mm2分をMCDと言う一つのダイで共有化することができます。
モノリシックなAD102とチップ面積自体は恐らく似たような規模になると思われますが、どちらがコストがかからないかは一目瞭然となっています。
当初2GCDから1GCDになったときはMCMにする意味があるのかと思いましたが、確かにこの構成ならば、意味がありそうです。
性能はRDNA2よりも効率を極めるならば、75TFLOPSでも十分なゲーム性能を発揮する。
AmpereのGA102はFP32演算性能あたりのゲーム性能がTuringと比較してもあまり高くありません。
GA102(RTX3090Ti)・・・TmeSpyScore=21,805/FP32=40TFLOPS
TU102(RTX2080Ti)・・・TimeSpyScore=14,579/FP32=13.45TLOPS
Navi21(RX6950XT)・・・TimeSpyScore=21,752/FP32=23.8TFLOPS
FP32演算性能1TFLOPS当たりのTimeSpySocreはそれぞれ以下のようになります。
GA102(RTX3090Ti)・・・545.125
TU102(RTX2080Ti)・・・1083.941
Navi21(RX6950XT)・・・913.95
となっています。
明らかにGA102だけがガクンとゲーム性能が落ちており、先日リークしたAD102のTimeSpyExtremeのスコアからこの傾向はGA102とほとんど変わらないことが判明しています。
逆にレンダリングなどのクリエイター用途では演算性能並みの結果が出ており、RDNA2の結果は奮いませんでした。
このことからゲームの側で何らかの事情で増えた演算器の性能を生かしきれてないというのが原因なのでしょう。
少なくとも今のところのリーク情報を総合するとゲームに関しては75TFLOPSのNavi31と100TFLOPSのAD102(RTX4090Ti)でほとんど性能が変わらないと判断できます。
当初15,536SPと言われたNavi31は12,288SPとトーンダウンしましたが、実際には実現できなかったのではなく、する必要が無かったと判断してよさそうです。
しかし、現代では既に性能の勝負ではなくなりつつある。
RDNA3はこのままいけばワット当りの性能と価格辺りの性能でAD102を圧倒出来ると思います。
しかし、RTやDLSSなど様々な新しい技術が公開され、マイナーなソフトウェアの互換性なども加味すると、なかなかRadeonを選ぶのには勇気がいります。
遠い昔ならともかく、現代ではブランドになっているGeforceがやはり強いです。
AMDは根気強くRadeonの性能を高めて、性能のRadeon、人気のGeforceと言うような評価を繰り返し一般ユーザーから受ける必要があると思います。
地味で報われない道ですが、結局はそれが一番の近道だと思います。