※ 画像は記事の内容をもとにしたイメージで、必ずしも現実を反映しているわけではありませんので注意してください。
■事実
AMD次世代GPUアーキテクチャ「RDNA 5」について、Linuxカーネルのパッチ動向を継続的に追跡している日本語解析プラットフォーム「Coelacanth-Dream」が、命令レベルの重要な最適化を明らかにした。
今回焦点となっているのは「Dual Issue VALU(Vector Arithmetic Logic Unit:ベクタ演算ロジックユニット)」と呼ばれるアーキテクチャ機能だ。
Dual Issue VALUは1クロックサイクルあたり2命令を並列実行できる二重演算レーン構造を持ち、理論上はFP32(単精度浮動小数点)の演算スループットを実質2倍に引き上げることができる。
ただし、Dual Issue VALUはRDNA 5が初めて搭載した機能ではない。
AMDはすでにRDNA 3(Radeon RX 7000シリーズ)およびRDNA 4(Radeon RX 9000シリーズ)にもDual Issue VALUをハードウェアレベルで搭載していた。
問題は、RDNA 3・RDNA 4の世代では、ゲームエンジンのコンパイラがDual Issue VALUを有効活用できるようにコードを整列・グループ化する手段が事実上存在しなかった点だ。
ハードウェアとして二重発行に対応しているにもかかわらず、タスクを適切にペアリングして二つの演算レーンへ振り分けるメカニズムが欠如していたため、設計上の理論値どおりの演算性能が発揮されない状況が続いていた。
RDNA 5はこの課題を解決するために「FMA(Fused Multiply-Add:積和演算命令)」を新たに導入した。
FMAとは乗算と加算を組み合わせた複数の演算ステップを一つの命令として処理できる仕組みで、コンパイラが複雑なALU演算を自動的にペアリングしてDual Issue VALUの二重レーンへ振り分ける作業を格段に容易にする。
この改善によってRDNA 5はDual Issue VALUを設計意図どおりに活用し、FP32演算スループットで理論ピーク性能に到達できる可能性を持つとされる。
ゲームアプリケーションにおいては、標準的なラスタライズ描画においてフレームレートの向上とフレームタイムの安定化として体感できる改善が見込まれる。
FMA命令はニューラルネットワーク処理やAIワークロードとの親和性も高く、次世代アップスケーリング技術「FSR Diamond(FidelityFX Super Resolution Diamond)」やフレーム生成機能の性能向上にも寄与するとされている。
FSR Diamondは2026年3月のGDC 2026においてAMDのSVPおよびコンピューティング&グラフィックス部門GMのジャック・フイン氏が発表した次世代アップスケーリングスイートで、Xboxの次世代コンソール「Project Helix」との多年度共同エンジニアリングプロジェクトとして位置づけられている。
同技術はMLベースのアップスケーリング・MLベースのマルチフレーム生成・次世代レイ再生成・ニューラルレンダリングの4要素を統合しており、XboxのゲームSDK(GDK)にネイティブ統合される設計だ。
信頼性の高いリーカーKepler_L2によれば、FSR DiamondはRDNA 5が持つ新世代AI/ML加速機能に依存するため、RDNA 4以前のGPUへの移植は困難であり、事実上RDNA 5専用になるとの見通しが示されている。
RDNA 5のハードウェア仕様はまだ公式発表がなく、以下はすべてリーク・噂情報に基づく。
フラッグシップモデルはTSMCのN3P(3nmクラス)プロセスを採用し、96 Compute Unit(コア数12,288基)・36GB GDDR7・384bitメモリバスという構成が噂されている。
Compute Unitあたりのコア数はRDNA 4の64コアから128コアへ倍増する設計とされており、アーキテクチャ全体の抜本的な刷新を示唆している。
ラインナップはフラッグシップ96 CUに加え、ミッドレンジの40 CU(5,120コア)・24 CU(3,072コア)、エントリーレベルの12 CU(1,536コア)の計4ダイ構成が噂されている。
プロセスノードの移行(RDNA 4のTSMC N5→RDNA 5のN3P)によって、クロックあたり性能は最大18%向上、消費電力は最大36%削減される見通しとされている。
リリース時期は2027年中頃が有力視されており、次世代PlayStation 6(Project Amethyst)およびXbox(Project Helix)向けの半導体においてもRDNA 5ベースのGPUコアが採用される予定とされている。
APUロードマップでは、RDNA 5はZen 6ベースの「Medusa Halo」(プレミアム向け)に搭載される一方、主流向けの「Medusa Point」はRDNA 3.5を継続採用する2段構成が2029年まで維持される見通しとされている。
Dual Issue VALU+FMAに加え、「Neural Arrays」と呼ばれる専用AI演算ブロック、新世代レイアクセラレータ「Radiance Cores」、「Universal Compression」といった新機能の追加もRDNA 5では噂されている。
今回Coelacanth-Dreamが明らかにした改善は、ハードウェアの追加を伴わずにソフトウェアスタック(コンパイラ向け命令セットの整備)によって既存ハードウェアの理論値を引き出すアプローチである点が特徴的だ。
Coelacanth-DreamはFMA・Dual Issue VALUおよびその他の技術詳細についてさらに踏み込んだ解析を公開しており、詳細に関心のある読者は同プラットフォームを参照することを勧める。
※ 画像は記事の内容をもとにしたイメージで、必ずしも現実を反映しているわけではありませんので注意してください。
解説
正直、これはかなり興味深い話です。
「性能が2倍」という数字だけ聞くと「またGPUメーカーの大げさなマーケティングか」と思いたくなりますが、今回の話の構造は単純な誇大広告とは性格が違います。
重要なのは「2倍の性能を実現するハードウェアはRDNA 3の時点からすでに存在していたのに、コンパイラがそれを使いこなせていなかった」という事実です。
RDNA 5ではFMA命令を追加することで、コンパイラ側が「この演算とあの演算をペアにして二重レーンに流せる」と自動的に判断できるようになった。
「新しいトランジスタを大量追加して性能を上げる」のではなく、「すでに存在しているハードウェアの使い残しを回収する」という発想です。
付加的なシリコン面積を消費せずに理論値へ近づけられるという点で、エンジニアリング的には非常に効率的なアプローチだと思います。
ただ個人的に引っかかっているのは、なぜRDNA 4でこれが実現できなかったのかという点です。
RDNA 4もDual Issue VALUを搭載していたのだから、FMAを追加することは原理的には不可能ではなかったはずです。
アーキテクチャ上の制約なのか、開発優先順位の問題なのか、あるいはRDNA 5との差別化のために意図的に温存したのか——今のところ明確な説明はありません。
これが意図的な温存だとすれば、RX 9070 XTユーザーとしては複雑な気持ちになりますね。
FSR DiamondがRDNA 5専用になりそうな話も、同じ文脈で読めます。
AMDはRDNA 4でMLベースのFSR 4(現在はFSR Redstoneとリブランド)をRDNA 4専用とし、RX 7000シリーズ(RDNA 3)ユーザーへの公式対応を行っていません。
モッダーがFSR 4.1のDLLをリークして非公式にRDNA 3対応を実現したことでその可能性は証明されましたが、AMDの公式サポートはいまだ来ていません。
今度はRDNA 4ユーザーもFSR Diamondから外れる可能性が高く、「二世代連続で最新AIアップスケーリングの対象外」という状況が生まれます。
NVIDIAはDLSS 4のトランスフォーマーモデルをRTX 2000番台まで提供しており(マルチフレーム生成はRTX 5000シリーズ限定ですが)、アップスケーラー本体のレガシーサポートという点でAMDは明確に見劣りします。
この背景にはAMDのAIアクセラレーター設計の歴史的な遅れがあります。
NVIDIAはRTX 2000シリーズ(2018年)から独立したTensorコアをGPUに組み込んできました。
AMDはRDNA 4まで、AI演算をCompute Unit内の汎用演算器で対応する方針を続け、独立したAIアクセラレーターを持たなかった。
RDNA 5でようやく「Neural Arrays」と呼ばれる専用AIブロックが追加される見通しで、これが整って初めてFSR DiamondのようなML集約型技術を本格的に動かせる土台ができます。
FSR 4をRDNA 3に移植しにくい理由と、FSR DiamondをRDNA 4に移植しにくい理由は、根本的には同じ問題——「前世代のAIハードウェアでは新世代のML要求を満たせない」——から来ているわけです。
コンソール戦略との絡みでいえば、2027年というRDNA 5のリリース時期はPlayStation 6・Xbox Project Helixの発売とほぼ重なります。
コンソール向けに大量供給する半導体から得られる生産技術・歩留まりの知見と、FSR Diamondのような共同開発技術をPC向けGPUへ直接還元できる構造は、NVIDIAやIntelが持ち得ないAMDの独自の強みです。
「2倍」という数字がどの程度実際のゲームに効いてくるかは、実際のベンチマークを待つ必要があります。
FP32依存のラスタライズ処理では大きな恩恵が見込まれますが、パストレーシングや特定のシェーダーパターンでは演算の性質が異なるため、Dual Issue VALUの効果が限定的なケースも出てくるでしょう。
また、FMAによる最適化はコンパイラの対応が前提になるため、ゲームエンジンのアップデートやドライバ最適化が揃って初めて本来の性能が出る——という展開も考えられます。
ソフトウェアエコシステムの整備がRDNA 5の真価を左右するという意味では、ハードウェア発表後の展開が同じくらい重要です。
「ハードウェアの使い残しを回収する」アプローチが成功するかどうかが、RDNA 5の実際の評価を決定づけるでしょう。