本日、AMDは次世代RDNA 3グラフィックス・カード、Radeon RX 7900 XTX & RX 7900 XTグラフィックス・カードを発表しました。
AMD Radeon RX 7900 XTが実効クロック3.5GHzまでオーバークロック、RDNA 3「Navi 31」GPUはLN2で4GHzに達するかもしれない
このカードは、NVIDIA RTX 4080と同様のラスター性能を低価格で提供していますが、レイトレーシングのクランチパワーはなく、AMDがチップレットアーキテクチャを採用しているにもかかわらず、GPUはRTX 4080に搭載されているAda「AD103」GPUの狂気の効率にどうしても敵わないのです。
しかし、そうは言っても、どちらのグラフィックスカードも市場で多くの可能性を秘めていることは間違いありませんし、以前見たように、AMDグラフィックスカードは時間が経つにつれて良くなる傾向があります。
しかし、この話題はまた別の日に取り上げ、今日は、RDNA 3のオーバークロック性能についてお話しします。
※ 画像をクリックすると別Window・タブで拡大します。
Twitterの仲間である0x22hは、AMD Radeon RX 7900 XTグラフィックスカードでテストを繰り返しており、Navi 31チップで最速のオーバークロック速度を得ることに成功したようだ。
RX 7900 XTは、最大3.5 GHzのシェーダークロックと3.7 GHzのフロントエンドクロックにオーバークロックされました。
これは、フロントエンドクロックとシェーダークロックが1.2GHz向上していることになり、非常に印象的である。
カードは最大400Wのボードパワーでピークに達し、355WのTGPより45W高く、温度はホットスポットの温度で62Cと85Cのあたりで安定した。
この素晴らしいオーバークロックにより、GPUは最大75 TFLOPsのFP 32演算性能を発揮し、標準クロックのグラフィックスカードと比較して44%向上しました。
また、0x22hは、AMDのRDNA 3アーキテクチャの最大の問題は、SIMD32ユニットにはレジスタの対応策がなく、WAVE32ユニットの2つのFMA命令では、オペランドレジスタごとに1ソース、共有即値1つしか使えないことだと報告する。
このため、実際の理論値の5/6程度の性能しか得られない。
RDNA 3の上位GPU「Navi 31」にはバグがあるという噂があり、AMDに直接確認はできていないが、レビュアーによるテストでは、カードにパワーリークとクロックの変動があることが判明している。
RDNA3最大的问题就是,增加SIMD32之后,寄存器方面几乎没有任何配套措施。Wave32的VOPD格式下的两个个FMA指令只能各自使用一个源操作数寄存器和一个共享的立即数。Wave64下面也是类似的情况,而且峰值性能只有理论值的5/6。 pic.twitter.com/iaIEdYlznf
— 0x22h (@0x22h) December 12, 2022
また、ほとんどのレビュアーは、AMD Radeon RX 7900グラフィックス・カードのピークアウトが約3GHzで、NVIDIA GeForce RTX 4000シリーズと同じでしたが、パフォーマンスの恩恵ははるかに少なかったのです。
AMDは、明日、最初のRDNA 3フラッグシップを発表する予定なので、明日、どのグラフィックス・カードを手に入れるか、決心したなら教えてください。
解説:
RDNA3が高性能化を断念したのはバグが原因か?
元記事中の気になる記述としては
AMDのRDNA 3アーキテクチャの最大の問題は、SIMD32ユニットにはレジスタの対応策がなく、WAVE32ユニットの2つのFMA命令では、オペランドレジスタごとに1ソース、共有即値1つしか使えないことだと報告する。
このため、実際の理論値の5/6程度の性能しか得られない。
このため、RTX4090と性能競争をしても分が悪いと判断したというのがAMDが今回の性能競争から降りた原因なのかもしれません。
実際、OCの結果を見るとLN2を使用してRX7900XTが75TFLOPS出せるならば、演算ユニット数が多いXTXは空冷でも75TFLOPSに楽に行けそうな気配で、今回、AMDがトップ争いから降りたのはこのバグが原因なのかなと私は感じました。
互角に戦えるチャンスを生かせなかったAMD
何かパッとしない話だなあと思います。
元々Navi31はAda Lovelaceと比較するとあまりトランジスタ数が多くなく、その上このようなバグがあるならば、効率を重視したほうが良かったことは確かです。
しかし、せっかくチップレットやRDNA3と言う元々効率重視の技術を採用し、Geforceと互角に戦えるチャンスがありながらそれを生かせないのは近年ジリジリとシェアを落としているAMDらしいパッとしない話だなあと思いました。
今回の欠陥を見ると、RDNA3のアーキテクチャーそのものの問題のようですから、解決するには再設計が必要だと思いますので、RX7000世代はこのハンデを負ったままになるのかなあと思います。
来年には恐らく、MCD部分のみを改良した3D V-Cacheを搭載したRX7950XTXが投入されると思います。
それでも、AD102のフルシリコンを採用するRTX4090Tiに抗するのはかなり厳しいのではないかと感じてしまいました。
RTX4000シリーズ世代のパフォーマンスキングはこのAD102のフルシリコン製品(RTX4090Ti)だと思います。
RDNA3のパフォーマンスキングはMCD部分のみを改良した3D V-Cacheを搭載したRX7950XTXですね。
こちらは、TDPの変更がなければボードがそのまま使えると思いますので、コスト的に非常に優れた仕組みだと思います。
nvidiaも次はチップレットを採用してくるのではないかと思いますので、チップレットが前提の仕組みを採用すればまた効率を一段上げられるのではないかと思います。
そのため、RTX5000シリーズvs次世代RadeonではGeforceに対する性能的なビハインドをまた負ってしまうのではないか?と危惧してしまいます。
AMDのGPU Radeonシリーズ
Radeon 7000シリーズ
Radeon RX 6000シリーズ
※ SAPPHIREはAMD Radeon専業のメーカーであり、Radeonのリファレンス的なメーカーです。