AMDは、未発表のNavi 32およびNavi 33チップを含むRDNA 3 GPUトリオの最大演算ユニット数を確認した。
AMD RDNA 3 GPU Compute Unitsの確認。Navi 31は96個、Navi 32は60個、Navi 33は32個
Angstronomicsからのリーク以来、AMD RDNA 3 GPUラインナップのCompute Unitsの数は謎に包まれていませんでしたが、今回のリークは@Kepler_L2が発見したROCm Softwareの更新という形でAMDから直接もたらされたものです。
このアップデートでは、3つのRDNA 3チップのピークコア数について、以下のように言及しています。
- Navi 31 GPU = 96演算ユニット
- Navi 32 GPU = 60演算ユニット
- Navi 33 GPU = 32演算ユニット
AMD Navi 31 “Plum Bonito” GPU構成図
AMD Navi 31 GPUは、フラッグシップのRDNA 3チップで、Radeon RX 7900 XTXやRX 7900 XTグラフィックスカードのような次世代エンスージアストカードに搭載されるものである。
各WGPにはデュアルCU(Compute Units)が搭載されるが、RDNA 2では各CUに2つしかなかったSIMD32クラスタが2倍になる。
このチップには、TSMC 5nm(GCD)とTSMC 6nm(MCD)のプロセスノードが混在している。
- AMD Navi 31:12,288コア、384-bitバス、96MB Infinityキャッシュ、300mm2 GPUダイ @5nm
- AMD Navi 21:5,120コア、384ビットバス、128 MB Infinityキャッシュ、520mm2 GPUダイ @7nm
RDNA 3アーキテクチャのAMD Navi 31 GPUは、96個のCompute Unit、48個のWGP、12個のSA、6個のSEを搭載したシングルGCDを提供すると見られる。
これにより、合計で6,144 SP、12,288コアを提供することになる。
これは、Navi 21 GPUの5,120コアと比較して、2.4倍のコアの増加です。
※ 画像をクリックすると別Window・タブで拡大します。
Navi 31 GPUは、1チップあたり16MBのInfinity Cacheと、64ビット(32ビット×2)メモリコントローラを搭載し、384ビットバスインターフェースを提供する6つのMCDを搭載する。これらのチップレットまたはMCDは、TSMCの6nmプロセスノードで製造され、1個あたりのサイズは37.5mm2となる予定です。
AMD Navi 32 “Wheat Nas” GPUの構成
AMD Navi 32 GPUのコードネームは「Wheat Nas」で、RDNA 3のラインナップに搭載される2つのMCM GPUのうちの1つでもある。
このGPUは、1個のGCD(Graphics Compute Dies)と4個のMCD(Multi-Cache Die)で構成されるという。
GPU(GCD)のサイズは200mm2、MCDのサイズは37.5mm2とされる。
- AMD Navi 32:7,680コア、256-bitバス、64MB Infinity Cache、200mm2 GPU ダイ @5nm
- AMD Navi 22:2,560コア、192-bit Bus、96MB Infinity Cache、335mm2 GPU ダイ @7nm
GCD は 3 つのシェーダーエンジンを搭載し、各シェーダーエンジンには 6 つのシェーダーアレイが搭載される予定です。
GPUは、30WGPまたは60Compute Unitで、合計7680コアを搭載する。また、各MCDは、2つのメモリコネクトリンク(32-bit)を備えているはずです。
つまり、合計8個の32-bitメモリコントローラで、256-bitのバスインターフェイスを実現する。
AMD Navi 32 “Hotpink Bonefish” GPUの構成図
AMD Navi 33 GPU(コードネーム:Hotpink Bonefish)は、RDNA 3ファミリのモノリシックセグメントをスタートさせる。
このGPUは、シングルダイを採用する。ダイはフラッグシップのNavi 21 GPUと非常に似ており、6nmプロセスノードを利用して製造され、ダイサイズは203mm2になると予想される。
- AMD Navi 33:4096コア、128-bitバス、32MB Infinity Cache、335mm2 GPUダイ@6nm
- AMD Navi 23:2048コア、128-bitバス、32MB Infinity Cache、237mm2 GPUダイ @7nm
Navi 33 GCDは、2つのShader Engineを搭載し、各Shader Engineは2つのShader Array(SEあたり2つ、合計4つ)を持つ見込みだ。
これは、16 WGPまたは32 Compute Unitsの合計4096コアとなり、Radeon RX 6800 “Navi 21 XL” GPUより高い数値となる。
このGPUは、Navi 23 GPUと同じ32MBのInfinity Cacheを搭載し、128ビット幅のバスで動作する。
最初のAMD RDNA 3 GPUは、Navi 31を搭載したRadeon RX 7900 XTX & RX 7900 XTグラフィックスカードとして、12月13日に発売される予定である。
2023年の前半には、Navi 32とNavi 33のGPUが登場する可能性が高く、CES 2023年頃には、モバイルNavi 32 GPUの発表が予想される。
AMD RDNA 3 Navi 3X GPUの構成(速報値):
GPU名 | Navi 21 | Navi 33 | Navi 32 | Navi 31 | Navi 3X |
コードネーム | Sienna Cichlid | Hotpink Bonefish | Wheat Nas | Plum Bonito | 不明 |
製造プロセス | 7nm | 6nm | 5nm/6nm | 5nm/6nm | 5nm/6nm |
パッケージ | モノリシック | モノリシック | MCM (1 GCD + 4 MCD) |
MCM (1 GCD + 6 MCD) |
MCM (不明) |
ダイサイズ | 520mm2 | 203mm2 (GCDのみ) |
200mm2 (GCDのみ) 425mm2 (MCD込) |
300mm2 (GCDのみ) 522mm2 (MCD込) |
不明 |
シェーダー エンジン数 |
4 | 2 | 3 | 6 | 8 |
WGP数 | 40 | 16 | 30 | 48 | 64 |
WGP毎の SP数 |
128 | 128 | 128 | 128 | 128 |
演算ユニット 数 (ダイ毎) |
80 | 32 | 60 | 96 | 128 (チップ毎) 256 (合計) |
SP数 (ダイ毎) | 5,120 | 2,048 | 3,840 | 6,144 | 4,096 |
ALU数 (ダイ毎) |
5,120 | 4,096 | 7,680 | 12,288 | 16,384 |
メモリバス幅 | 256-bit | 128-bit | 256-bit | 384-bit | 384-bit x2? |
メモリ種類 | GDDR6 | GDDR6 | GDDR6 | GDDR6 | GDDR6 |
メモリ容量 | 最大16 GB | 最大8 GB | 最大16 GB | 最大24 GB | 最大32 GB |
メモリ速度 | 16-18 Gbps | 不明 | 不明 | 20 Gbps | 不明 |
メモリ帯域幅 | 512-576 GB/s | 不明 | 不明 | 960 GB/s | 不明 |
インフィニティ キャッシュ |
128 MB | 32 MB | 64 MB | 96/192 MB | 不明 |
フラッグシップ SKU |
Radeon RX 6900 XTX |
Radeon RX 7600 XT? Radeon RX 7700M? |
Radeon RX 7800 XT? Radeon RX 7900M? |
Radeon RX 7900 XTX |
Radeon Pro |
TBP (最大) | 330W | ~150W | ~250W | 335W | 不明 |
発売時期 | 2020Q4 | 2022Q4? | 2022Q4? | 2022Q4? | 2023? |
解説:
Navi32とNavi33のCU数が確定
Navi32は60CU、3840SP、7680ALU
Navi33は32CU、2048SP、4096ALU
と言うことになります。
既にご承知の通り、RDNA3からSP内の演算器が倍増され、SP当たりの演算性能が倍になっていると推測されています。
しかし、先行するGeforceもCUDAコア数が倍になってFP32演算性能が倍増したにも関わらず、ゲーム性能は倍になりませんでしたので、AMDはそのように表記しないようです。
よってRadeonも演算器の数に綺麗にゲーム性能が比例しないことが予測できます。
今までSP数と表記していたものは演算器数と表記するようですね。
これをもとにRDNA2世代と比較した表を出してみました。
RDNA2世代簡易仕様・性能一覧(上位モデル)
モデル名 | RX6950XT | RX6900XT | RX6800XT | RX6800 | RX6750XT | RX6700XT | RX6700 |
チップ名 | Navi21 | Navi21 | Navi21 | Navi21 | Navi22 | Navi22 | Navi22 |
SP数 (有効/フル) |
5,120/5,120 | 5,120/5,120 | 4,608/5,120 | 3,840/5,120 | 2,560/2,560 | 2,560/2,560 | 2,304/2,560 |
ALU数 (有効/フル) |
5,120/5,120 | 5,120/5,120 | 4,608/5,120 | 3,840/5,120 | 2,560/2,560 | 2,560/2,560 | 2,304/2,560 |
FP32 演算性能 |
23.8 | 23.04 | 20.74 | 16.17 | 13.31 | 13.21 | 11.29 |
FSE(DX11) スコア |
30,198 | 27,847 | 25,821 | 21,509 | 18,232 | 17,471 | 15,101 |
TS(DX12) スコア |
21,796 | 18,789 | 17,960 | 15,116 | 13,559 | 12,121 | 11,191 |
RDNA2世代簡易仕様・性能一覧(下位モデル)
モデル名 | RX6650XT | RX6600XT | RX6600 | RX6500XT | RX6400 | PS5(参考) | XboxSX(参考) |
チップ名 | Navi23 | Navi23 | Navi23 | Navi24 | Navi24 | 一体型SoC | 一体型SoC |
SP数 (有効/フル) |
2,048/2,048 | 2,048/2,048 | 1,792/2,048 | 1,024/1,024 | 768/1,024 | 2,304/不明 | 3,328/不明 |
ALU数 (有効/フル) |
2,048/2,048 | 2,048/2,048 | 1,792/2,048 | 1,024/1,024 | 768/1,024 | 2,304/不明 | 3,328/不明 |
FP32 演算性能 |
10.79 | 10.6 | 8.982 | 5.765 | 3.565 | 10.3 | 12 |
FSE(DX11) スコア |
13,488 | 13,291 | 11,070 | 6,762 | 5,041 | 不明 | 不明 |
TS(DX12) スコア |
10,005 | 9,722 | 8,121 | 4,960 | 3,607 | 不明 | 不明 |
RDNA3世代簡易仕様・性能一覧
モデル名 | RX7900XTX | RX7900XT | RX7800XT? | RX7700XT? |
チップ名 | Navi31 | Navi31 | Navi32 | Navi33 |
SP数 (有効/フル) |
6,144/6,144 | 5,376/6,144 | 3,840/3,840 | 2,048/2,048 |
ALU数 (有効/フル) |
12,288/12,288 | 10,752/12,288 | 7,680/7,680 | 4,096/4,096 |
FP32 演算性能 |
61 | 52 | 38.13 | 20.33 |
FSE(DX11) スコア |
不明 | 不明 | 不明 | 不明 |
TS(DX12) スコア |
不明 | 不明 | 不明 | 不明 |
上の表のようになる。
順当にいけば(演算器数に綺麗に比例すれば)、最低でもNavi32はRX6950XTの1.6倍程度の性能は発揮できることになる。
また、Navi33もRX6800XTと同等レベルの性能は発揮できることになる。
しかし、Ampere世代でGeforceもCUDAコアの数に比例したゲーム性能にならなかったことを考えると、Radeonも同じようにはいかないと思われる。