AMD Radeon RX 7950 XT「RDNA 3」グラフィックカードの「疑惑」仕様がGreymon55によって明らかにされた。
この新しい仕様は、以前に聞いた話と一致していますが、AMDは、来るべきRadeon RX 7000シリーズファミリーに複数のNavi 31 SKUを導入することを計画している可能性があるようです。
AMD Radeon RX 7950 XTは15360 RDNA 3コア、512MB Infinity Cache搭載の大規模32GBメモリ、500W TBPで最大2.5GHzのクロックを特徴とする。
AMD RDNA 3ベースのNavi 31 GPUは、以前から話題に上っていた。
噂やリークによって、このGPUについて多くのことが分かっているのは、正気の沙汰とは思えません。
これは、リーク者や詳細を掲載しているソースが、これまでの情報投下からかなり信頼性が高いにもかかわらず、これらの情報のすべてを塩漬けにして扱うべき理由の1つでもあります。
なお、この投稿はエイプリルフールのネタではなく、Greymon55も返信でそのことを確認しています。
https://twitter.com/greymon55/status/1509766399803109381?ref_src=twsrc%5Etfw
そこで、まずは次世代グラフィックスカード「Radeon RX 7900 XT」を搭載するフラッグシップチップ「RDNA 3」のGPU「AMD Navi 31」からご紹介します。
Olrak29_は、Twitter上で流れているすべての噂を基に、チップのブロック図を組み立てることに成功しました。
AMDが次世代RDNA 3 GPUでCU(Compute Units)をやめてWGP(Work Group Processors)を採用するという話は聞いたことがある。
今回紹介するNavi 31のGPU構成は、2つのGCD(Graphics Core Die)と1つのMCD(Multi-Cache Die)を搭載している。
各GCDは3つのShader Engine(計6個)を持ち、各Shader Engineは2つのShader Array(SEあたり2個/GCDあたり6個/計12個)を持つ。
各Shader Arrayは5つのWGP(SEあたり10個/GCDあたり30個/合計60個)で構成され、各WGPには32個のALUを持つSIMD32ユニットが8個(SAあたり40 SIMD32 / SEあたり80 / GCDあたり240 / 合計480個)搭載されている。
これらのSIMD32ユニットを組み合わせ、1GCDあたり7,680コア、合計15,360コアを構成しています。
※ 画像をクリくすると、別window・タブで拡大します。
Navi 31(RDNA 3)のMCDは、次世代Infinity FabricインターコネクトでデュアルGCDにリンクされ、256~512MBのInfinity Cacheを搭載する予定。
また、各GPUは、4本のメモリコネクトリンク(32-bit)を搭載するはずだ。つまり、256-bitのバスインターフェイスに対して、32-bitのメモリコントローラを合計8個搭載することになる。
AMD Radeon RX 7950 XT「RDNA 3」グラフィックスカードの仕様
Radeon RX 7000シリーズのフラッグシップグラフィックスカードであるAMD Radeon RX 7950 XTは、Navi 31 GPU構成を採用し、合計15360個のストリームプロセッサと2.5 GHzのクロックを持つことになります。
これが最大クロックかどうかはわかりませんが、Radeon RX 6900 XTと比較して最大クロックが11%向上し、38.4 TFLOPsの有効FP32演算性能を実現します。
これはRX 6900 XTと比較して67%の演算性能の向上となります。
また、TBPが500Wの6900 XTよりも200W高く、こちらも67%向上しているのが特徴です。
メモリ構成については、AMD Radeon RX 7950 XTは、現在のフラッグシップモデルの16GBに対して、2倍の32GBのメモリ容量を搭載すると予想されます。
メモリバスインターフェイスは256bitのままだが、より高速な(21Gbps)GDDR6ダイにより、AMDは512GB/s以上の内部バンド幅(最大672GB/s)を叩き出すことができる。
Infinity Cacheデザインに関しても、Navi 31 GPUに搭載されている512MBで倍増する。
このスペックは、NVIDIAのGeForce RTX 4000「Ada Lovelace」のラインナップに挑むのに十分な、モンスター級のものであることは確かです。
もう1つ付け加えると、AMDは新しい16ピン(12+4)コネクタ規格をすぐに採用するつもりはなく、少なくともRadeon RX 7000シリーズグラフィックスカードには採用する予定がないと、独自の情報筋から聞いている。
その理由は、AMDがまだ安定していないと考えているからだそうですが、AMDの7000シリーズのデザインは、この規格の導入前に完成していたようなのです。
AMD RDNA GPU(世代間比較)速報:
GPU名 | Navi 10 | Navi 21 | Navi 31 |
製造プロセス | 7nm | 7nm | 5nm (6nm?) |
GPU パッケージ |
Monolithic | Monolithic | MCD (マルチチップ レットダイ) |
シェーダー エンジン |
2 | 4 | 6 |
GPU WGP数 | 20 | 40 | 30 (MCD毎) 60 (合計) |
WGP毎の SP数 |
128 | 128 | 256 |
Compute Unit数 (ダイ毎) |
40 | 80 | 120 (MCD毎) 240 (合計) |
コア数数 (ダイ毎) |
2,560 | 5,120 | 7,680 |
コア数 (合計) |
2,560 | 5,120 | 15360 (MCDx2) |
Peak Clock | 1905 MHz | 2250 MHz | 2500 MHz |
FP32演算性能 | 10 | 23 | 38 |
メモリバス幅 | 256-bit | 256-bit | 256-bit |
メモリ種類 | GDDR6 | GDDR6 | GDDR6 |
メモリ容量 | 8 GB | 16 GB | 32 GB |
インフィニティ キャッシュ |
N/A | 128 MB | 512 MB |
フラッグ シップSKU |
Radeon RX 5700 XT |
Radeon RX 6900 XTX |
Radeon RX 7950 XT |
TBP | 225W | 330W | 500W |
発売時期 | 2019Q3 | 2020Q4 | 2022Q4 |
AMD RDNA 3「Navi 3X」GPU搭載Radeon RXグラフィックスカードのラインナップは、既存のRDNA 2製品と比較して最大3倍の性能向上を実現すると予想されています。
AMDは、FSR 2.0やRaytracingなどの次世代技術をすでに搭載しており、赤と緑のチームと青のチームが追いつこうとする中で、非常に熱い次世代競争が繰り広げられると予想されます。
解説:
RX7950XTは512MB 3Dインフィニティキャッシュ、500W TBP、32GB GDDR6 21Gbps、2.5GHzクロック
らしいです。TBPはnVidiaがあり得ない領域に突っ込んできていますので、500Wとこれも今までの常識を覆すレベルになっています。
FP32演算性能は38.4TFLOPSで、RX6900XTは23.04TFLOPSの性能がありますので、+66.67%の性能向上と言うことになります。
※ コメントでご指摘を受けました。38.4TFLOPSは1ダイでの話で、GPU全体ではその倍である76.8TFLOPSになると思いますので、そのように読み替えてください。
AmpereのRTX3090は35.6TFLOPSですが、承知の通り、AmpereはFP32演算性能の割にゲーム性能が奮いません。
一説によると、増えすぎたCUDAコアをゲーム側が使いきれていないと言われていますが、最新のゲームでもRX6900XTと大差をつけたという話は聞きませんので、私は別の理由があるのではないかと思っています。
このスペックを見て「思ったより大したことがないな」と言うのが私の感想です。
今までのリークでは、RTX4090(?)がRTx3090の2.2倍、RX7900XTが2.5倍でRDNA3の方が実力では優れているという話だったのですが、FP32がRX6900XTの2倍行ってないのであれば、それほどの性能は絞り出せないのではないかと思っています。
性能のカギを握っているのはMCMと3Dキャッシュ
私は5800X3Dなどのリーク情報を見て、鍵を握っているのはMCMと3Dインフィニティ・キャッシュの性能だと思っています。
MCMはチップ間接続によりペナルティがどの程度あるのか?、3Dインフィニティキャッシュがクロック向上の足をどの程度引っ張るのか、熱はどうなるのか?この辺が総合的な性能を決めるカギだと思っています。
3Dインフィニティキャッシュの性能が奮わない場合、あまりクロックが上がりりません。
2.5GHzと言っている以上、2.5GHzまでは上がるのでしょうが、近年のGPUがかなりOC出来ることが当たり前になっています。
もしここで3Dインフィニティキャッシュが足を引っ張る場合、RTX4090/Tiとのベンチマーク競争に負ける可能性もあるでしょう。
これがまず一点。
今一つはコメントでもいろいろと意見をいただいているMCMにおけるチップ間接続のペナルティ
チップを二つくっつけるということは、チップ間を接続することになります。
その接続時における同期やアービトレーションを行う必要があると思いますが、その際にペナルティが発生する可能性があります。
それが解決できないとM1 Ultraのように、チップの規模の割には性能が奮わないということになろうかと思います。
色々と書いてきましたが、それでもRX7950XTは噂の段階でRTX4090/Tiを倒し、世界一の座に輝く唯一の可能性を持つスーパーGPUであることには変わりありません。
正直、それでもゲーマーはRTX4090/Tiを選ぶのだと思いますが、性能ナンバーワンの座に輝くことはそれでも意義が大きいと私は思っています。
電源周りに関してはAMDはPCIe5.0規格のコネクタは使わないということのようです。
配線はごちゃごちゃしますが、設計は安定すると思いますし、今までの電源を使われている方も安心できるのかなと思っています。
逆にRTX4090/Tiは電源周りに爆弾を抱えなけれは゛良いかなと感じました。