噂されていたRDNA3アーキテクチャの仕様が変更
Greymon55氏によれば、Navi 3X GPUの内部構造はこれまでと異なる可能性があるという。
15360 Stream Processorではなく、次期RDNA3シリーズのフラッグシッププロセッサであるNavi 31 GPUの12288である。
つまり、数日前の92TFLOPSという主張は間違いか、あるいはまだわからない何かがあるということになる。
6 Shader Engines、12 Shader Array、48 Work Group Processorsを搭載するNavi 31は、最大12288個のStream Processorで出荷されるが、これは以前に噂された15360コアに対して20%のコア数の削減となる。
Navi 32も同様で、10240コアの代わりに8192個のStream Processorを搭載することになる。
Navi 31では、5192コアの代わりに4096コアが搭載されることになるが、コア数の減少については、以前からGreymon55が言及していたことに注意する必要がある。
https://twitter.com/Redfire75369/status/1521052789996400640?ref_src=twsrc%5Etfw
Navi 31のスペックが更新されれば、噂のTFLOPSは73TFLOPSに下がり、これはGPUクロックが3.0GHzと仮定した場合の話だ。
Navi 32と33のクロック速度については、まだリークや噂がない。
https://twitter.com/3DCenter_org/status/1521062255063797760?ref_src=twsrc%5Etfw
新しい第3世代Navi GPUの発売まで、まだ数ヶ月あることを忘れてはなりません。
しかし、これは、1年以上にわたって共有されてきた噂のスペックに対する最初の大きなアップデートです。
そのため、他に信頼できるソースがない限り、これらのスペックは最終的なものに近いと考えられます。
さらに、以下に掲載したスペックは、あくまでもフルGPUの構成を表しており、7900/7700/7600シリーズでは発売時に保証されない可能性がある。
AMDは、Radeon RX 7000グラフィックスカードの歩留まりを高めるために、各GPUのスペックを下げることを選択する可能性があります。
AMD RDNA3 GPUの噂されるスペック
AMD NAVI 31 | AMD NAVI 32 | AMD NAVI 33 | |
製造プロセス | TSMC 5nm + 6nm | TSMC 5nm + 6nm | TSMC 6nm |
アーキテクチャー | AMD RDNA3 | AMD RDNA3 | AMD RDNA3 |
GPUパッケージ | マルチ・チップ ・モジュール (MCM) |
マルチ・チップ ・モジュール (MCM) |
モノリシック |
推定ダイ サイズ |
~800 mm² (or more) | TBC | ~440 mm² |
ダイ数 | 2 | 2 | 1 |
シェーダー エンジン数 |
6 | 4 | 2 |
シェーダー アレイ数 |
12 | 8 | 4 |
RDNA ワークグループ数 (WGP) |
60 → 48 | 40 → 32 | 20 → 16 |
演算 ユニット数 |
120 → 96 | 80 → 64 | 40 → 32 |
ストリーム プロセッサ数 |
15360 → 12288 | 10240 → 8192 | 5120 → 4096 |
GPUクロック | ~3.0 GHz | 不明 | 不明 |
メモリ種類 ・バス幅 |
GDDR6 256-bit |
GDDR6 192-bit |
GDDR6 128-bit |
インフィニティ キャッシュ |
256 – 512MB | 256 – 384MB | 128 – 256MB |
発売時期 | Q3/Q4 2022 | Q3/Q4 2022 | Q1 2023 |
噂での SKU | Radeon RX 7900XT | Radeon RX 7700XT | Radeon RX 7600XT |
FP32 演算性能 |
~ 92 → 73 TFLOPS | 不明 | 不明 |
解説:
RDNA3 Navi31のスペックがトーンダウン
15,360SPから12,288SPへ、FP32演算性能は92TFLOPSから73TFLOPSへ
RTX4090Tiが約100TFLOPSと噂されていますから、残念ながらスペックの時点で負けてしまっているということになります。
実際のゲーム性能はどうなるのかわかりませんが、エンコードやレンダリングではやはりRTX4090Tiの後塵を拝する可能性が高いと判断してもよいのではないでしょうか。
別の記事でも書きましたが、Ampereのゲーム性能がFP32演算性能の割に振るわない理由と言うのがはっきりしませんので、何とも言えないところです。
単にメモリの帯域が足りないだけならば、RTX4000シリーズから64bitメモリバス辺り16MBの大容量キャッシュを搭載することによって解決できると思われます。
実際、このスペックダウンは何が原因なのかちょっとよくわかりませんね。
元記事ではフルスペック(フルシリコン)が12,288SPになるのではないかと予想されています。
だとしたら、どんなに頑張っても12,288SPにとどまるということになります。
フルスペックが15,360で歩留まりを上げるために無効化する部分を多くしたというならわかりますが、ここにきてこの情報はかなり痛いです。
次世代はRadeonが性能では勝つと思っていたのですが、このスペックではLovelaceにはちょっとかないそうにありません。