GeForce RTX 4090 vs Radeon RX 7900XT、それとも別の何か?
なぜリーク者は同じ日に情報を共有する傾向があるのか、かなり興味をそそられますね。
重要なのは、Kopite7kimiとGryemon55の両氏は、彼らのリークが何度も真実であることが証明されているため、明らかに良い情報源を持っているということです。
NVIDIA RTX Ada GA102 GPUは21Gbpsのメモリを搭載?
Kopite7kimiが次世代GPUフラッグシップ「RTX」の新情報を入手したと思われる。興味深いのは、次期「Ada」GPUシリーズが、実はRTX 4000と呼ばれていることは、もはや間違いないということだ。
リーク者は現在、例えばRTX 50シリーズと呼ばれる場合に備えて、それらを**90/**80などで表記しているそうです。
いずれにせよ、Kopite7kimiはエイプリルフールに投稿したメッセージを更新したが、当時も指摘したように、確定したわけではなく、おそらく今も確定していない。この新しいメッセージは、SKU番号が330の4080クラスのGPUが、実際には4090シリーズに使われるかもしれないということですが。
さらに重要なのは、メモリのスペックが24Gbpsから21Gbpsにトーンダウンしており、これは実際にはRTX 3090 Tiと同じ速度であることだ。
この次期SKUは、TDPが600Wになる。このため、発売されたばかりのRTX 3090 Tiは、次世代GPUシリーズのテストビークルであるとする噂もあったようだ。
**90 PG137/139-SKU330, AD102-300, 24G 21Gbps, 600W
— kopite7kimi (@kopite7kimi) April 11, 2022
NVIDIAのボード番号PG137、PG139、PG141を共有することで、このリークの信憑性が著しく高まることは指摘しておくべきでしょう。
これは、実は、発売が近づけば、後で検証できることなのです。
7チップレットを搭載したAMD Navi 31
RDNA3やRadeon RX 7000シリーズのフラッグシッププロセッサである次期GPU「Navi 31」は、合計7チップレットを搭載すると現在噂されています。
AMDは、Fiji 10やVega 10/12のような複雑で高価なHBM GPU設計でハイエンドGPU分野で競争する試みが少し失敗した後、Navi 21 GPUでモノリシック設計に戻りました。
MCDチップレットが何のためにあるのかは、Greymonも他の誰一人としてわからないが、しかし、それはMemory Complex Dieであると長い間噂されていたものである。
そのため、Infinity Cacheやメモリコントローラが配置されている場所なのかもしれない。
それらのMCDチップレットが、GDC(Graphics Complex Dies)の上に配置されるのか、それともパッケージの別の場所に配置されるのかは、完全には確定していない。
maybe
31=
two 5nm GCD
four 6nm MCD
one interconnected controller
7 Chiplets in total— Greymon55 (@greymon55) April 11, 2022
Navi 31 GPUは、6nmまたは5nmのTSMCプロセス技術で製造された7チップレットを搭載すると予想されています。
INTEL ARC Bシリーズ (Battlemage)
少し前に、同社が偶然公開したIntelのテストドライバのおかげで、同社がBattlemageという次世代Xe-HPGアーキテクチャ、内部的にはElastiと呼ばれるアーキテクチャを開発中であることが判明した。
その中で、次世代グラフィックスプロセッサの4タイル構成を意味する「ELG_X4」というコンフィギュレーションが記載されていた。
現時点では、Battlemageのスペックや、AMDやNVIDIAに対する対抗馬は不明だが、同社は、GPU市場の上位層「Enthusiast」をターゲットとし、後に「Celestial」が「Ultra Enthusiast」セグメントまで到達することを公式に確認している。
Battlemageは2023/2024年まで発売されないが、RTX 4090やRX 7900XTがまだ市場にあるため、発売される可能性はある。
In each configuration below, it would have the corresponding amount of FP32 ALUs.
1T: 5120 (+25% ACM SoC1/G10)
2T: 10240 (x2.5 ACM SoC1/G10)
4T: 20480 (x5 ACM SoC1/G10)The 2 tile configuration is the most likely as it currently stands.
(4/5)
— Redfire (@Redfire75369) March 30, 2022
Redfireの分析によると、Battlemageの4タイル構成では、1タイルあたり40個のXe-Coreと320個のXe-Vector Engineを搭載する可能性があるという。
つまり、4タイル構成の場合、1280個のVector Engines(実行ユニット)を持つことになり、基本的には20480個のFP32コアを意味することになる。
もちろん、「ELG_X4」が本当にタイル構成を指しているのか、そのような部分が計画されているのかどうかはわからない。
しかし、推測の域を出ないが、これはIntelのハイエンド領域における興味深い競争となるだろう。
次世代フラッグシップGPUの比較(噂される)
GeForce RTX 4090 – Class | Radeon RX 7900 – Class | Arc B9XX – Class | |
製造プロセス | TSMC N5 | TSMC N5/N6 | 不明 |
アーキテクチャー | NVIDIA Ada | AMD RDNA3 | Intel Xe2-HPG “Battlemage” |
パッケージ | Monolithic | Multi-Chip- Module (MCM) | Multi-Chip- Module (MCM) |
ダイサイズ | ~600mm² | ~800mm² | 不明 |
ダイ数 | 1 | 2 GCD + 4 MCD + 1 IOD | 4 Tiles |
GPUメガ クラスター | 12 Graphics Processing Clusters (GPC) | 2×3 Shader Engines | 10 Render Slices |
GPUスーパー クラスター | 72 Texture Processing Clusters (TPC) | 2×30 RDNA Workgroups (WGP) | 40 Xe-Cores |
GPU Clusters | 144 Streaming Multiprocessors (SM) | – | 1280 Xe Vector Engines |
FP32演算コア数 | 18432 CUDA Cores | 15360 Stream Processors | 20480 FP32 ALUs |
GPUクロック | ~ 2.2 GHz | ~ 2.5 GHz | 不明 |
メモリ容量 ・種類 | 24 GB GDDR6X | 容量不明 GDDR6 | 不明 |
メモリ速度 ・バス幅 | 21 Gbps 384-bit | 速度不明 256-bit | 不明 |
キャッシュ | 96MB (L2 Cache) | 256 又は 512MB Infinity Cache | 不明 |
消費電力 | 600W (TDP) | 500W (TBP) | 不明 |
発売時期 | 2022Q3/Q4 | 2022Q3/Q4 | 2023-2024 |
噂される性能 | 2x GA102 | 2.5x NAVI 21 | 不明 |
解説:
Lovelaceだけではなく、RDNA3、battlemageの噂も続々登場
Lovelaceはひとつ前の記事で解説しましたので、省略します。
RDNA3は7チップ構成、あまりに多い数でちょっと驚きましたが、うち4つはMCD(Memory Complex Dies)らしいです。
このMCDが何なのかは全くわからないそうですが、RDNA3が絞り出す性能からすると、メモリ関連の機能が入っているダイで、チップ間通信のレイテンシを埋めるための役割を担っているものと思われます。
4個と数が多いのも、それが理由ではないかと思います。
Battlemageは時期的には来年以降の予定になっていますので、このくらいの性能がないと一線級では戦えないと思いますが、一気に4タイル、20480コアになるそうです。
正直、TSMC4nmか3nmでなければ実現できなさそうなスペックですが、製造プロセスは不明。
これが本当ならば、RDNA3やLovelaceを凌ぐGPUになるでしょう。
コアの性能が変わらなかったとしてもAlchemistの5120から一気に4倍ですから、相当の性能になると思われます。
本当に4タイルなのかどうかもはっきりしませんが、TSMC5nmクラスの製造プロセスに乗り遅れたIntelはこの時期が一番苦しいはずです。
CPUはハイブリッドと言う設計で乗り切っていますが、製造プロセスの差がモロに出るGPUはごまかしが効きませんので、どのように乗り切るのか注目です。
現実的に考えるとTSMC4nmが3nmを使うと考えるのが自然ですが・・・・。
nVidia RTX4000SUPER
nVidia RTX4000
nVidia RTX3000シリーズGPU
RTX3060 12GB GDDR6
RTX3050 6GB