NVIDIAのGeForce RTX 4090グラフィックスカードは、3DMark Time Spy Extremeベンチマークにおいて、RTX 3090の約2倍の性能を発揮していると報告されています。
NVIDIA GeForce RTX 4090、3DMark Time Spy ExtremeベンチマークでRTX 3090のほぼ2倍の速度、3GHzクロックも楽々達成との報告も
NVIDIA GeForce RTX 4090グラフィックスカードは、2022年のグリーンチームのフラッグシップ製品となる予定です。
このカードについては、年間を通じてさまざまなリークや噂がありましたが、私たちが知る限りでは、発売は2022年第4四半期ごろと多かれ少なかれ予想されています。]
発売まであと3~4ヶ月となった今、噂の焦点は仕様から性能の数字へと移ってきています。
RTX 4090, TSE >19000
— kopite7kimi (@kopite7kimi) July 18, 2022
yes
— kopite7kimi (@kopite7kimi) July 18, 2022
Kopite7kimiは、NVIDIA AD102 GPUが、100 TFLOPsの演算馬力を達成する最初のグラフィックスチップになることを最初に報告しました。
今回、同じリーカーが3DMark Time Spy Extremeでの性能データを公開しました。
リーク者によると、NVIDIA GeForce RTX 4090は、Time Spy Extremeベンチマークで19,000点を超えるトータルグラフィックススコアを実現するとのことです。
既存のカードと比較した場合、このスコアは、NVIDIA GeForce RTX 4090をRTX 3090より少なくとも90%、RTX 3090 Tiより70%高速にすることになります。
これは確かに大きなジャンプですが、ここでは純粋に合成ワークロードについて話していることを忘れてはいけません。
グラフィックスカードでのゲーミングは全く別の話かもしれませんし、このスコアが最終的なクロック/最適化に基づくものかどうかもわかりません。
これは、TSMCの4NプロセスノードがAda Lovelace GPUのクロック周波数を大幅に向上させたという以前の報告と一致しています。
So does NVIDIA, also easy.
— kopite7kimi (@kopite7kimi) July 18, 2022
https://twitter.com/kopite7kimi/status/1549052756136435713?ref_src=twsrc%5Etfw
NVIDIA GeForce RTX 4090の「噂」のスペック
NVIDIA GeForce RTX 4090グラフィックスカードは、トップAD102-300 GPUを搭載すると予想されているが、フルチップを搭載するのは「Ti」バリエーションのみである。
GeForce RTX 4090は、少しカットダウンされた構成を利用することになる。
NVIDIA GeForce RTX 4090は、144個のSMのうち128個のSMを使用し、合計16,384個のCUDAコアを使用します。
96MBのL2キャッシュを搭載し、合計384個のROPを搭載した、まさに狂気のGPUとなる予定です。
クロックは未定だが、TSMC 4Nプロセスを採用していることから、3.0GHz台、あるいはそれを超えるクロックが期待される。
コア数はRTX 3090の56%増なので、クロック、キャッシュ、アーキテクチャ、その他さまざまな技術が、これだけの大差で性能を押し上げているのだ。
メモリに関しては、GeForce RTX 4090は24GBのGDDR6Xを搭載し、384ビットバスインターフェースで21Gbpsの速度で動作すると予想されています。
これは、最大1TB/sの帯域幅を提供することになります。
これは既存のRTX 3090 Tiグラフィックスカードと同じ帯域幅で、消費電力に関しては、TBPは450Wと言われており、TGPはそれよりも低くなる可能性があるということです。
このカードは、最大600Wの電力を供給する1つの16ピンコネクタで駆動する予定です。
RTX 3090 Tiで見られたような500W以上のカスタム設計が登場する可能性もあります。
このグラフィックスカードは2022年10月に発売され、Ada Lovelace GPUを搭載した残りのラインナップがそれに続く予定です。
NVIDIA GeForce RTX 4090 Ti & RTX 4090「速報版」スペック:
グラフィック カード名 | NVIDIA GeForce RTX 4090 Ti | NVIDIA GeForce RTX 4090 | NVIDIA GeForce RTX 3090 Ti | NVIDIA GeForce RTX 3090 |
GPU名 | Ada Lovelace AD102-350? | Ada Lovelace AD102-300? | Ampere GA102-350 | Ampere GA102-300 |
製造プロセス | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
ダイサイズ | ~600mm2 | ~600mm2 | 628.4mm2 | 628.4mm2 |
トランジスタ数 | 不明 | 不明 | 280億 | 280億 |
CUDAコア数 | 18,432 | 16,128 | 10,752 | 10,496 |
TMU数 / ROP数 | 不明 / 384 | 不明 / 384 | 336 / 112 | 328 / 112 |
Tensor / RT コア数 | 不明 /不明 | 不明 /不明 | 336 / 84 | 328 / 82 |
ベース クロック | 不明 | 不明 | 1560 MHz | 1400 MHz |
ブースト クロック | ~2800 MHz | ~2600 MHz | 1860 MHz | 1700 MHz |
FP32演算性能 | ~103 TFLOPs | ~90 TFLOPs | 40 TFLOPs | 36 TFLOPs |
RT TFLOPS | 不明 | 不明 | 74 TFLOPs | 69 TFLOPs |
Tensor-TOPS | 不明 | 不明 | 320 TOPs | 285 TOPs |
メモリ容量 | 24 GB GDDR6X | 24 GB GDDR6X | 24 GB GDDR6X | 24 GB GDDR6X |
メモリバス幅 | 384-bit | 384-bit | 384-bit | 384-bit |
メモリ速度 | 24.0 Gbps | 21.0 Gbps | 21.0 Gbps | 19.5 Gbps |
メモリ帯域幅 | 1152 GB/s | 1008 GB/s | 1008 GB/s | 936 Gbps |
TGP | 600W | 450W | 450W | 350W |
価格 (希望小売 価格/ FE) | $1999 US? | $1499 US? | $1999 US | $1499 US |
発売時期 | 2023? | 2022/10? | 2022/03/29 | 2020/09/24 |
解説:
RTX4090のTimeSpy Extreme Scoreは19,000台
元記事のグラフには載っていませんが、RDNA2を実際のデータから、RDNA3を計算で出してみます。
RX6900Xtは9070、RX7900XTはRX6900XTの2.3倍と言われていますので20861となります。
RTX4090が19000ですから、RTX4090Tiは21660と言うことで、RX7900XTとほぼ同じと言うことになります。
ワッパ・コスパを考えると圧倒的にRDNA3が優れているということになり、RTX4090Tiが600Wと言われていることを考えると、このデータを見る限りRDNA3の方が有利と言うことになりますね。
この大容量の電源を使うということをどう考えるかによって売上や結果が違ってくるのではないかと思います。
これを見ると、RTX4000シリーズのFP32演算性能当たりのゲーム性能はRTX3000シリーズと大差がないということがわかります。
また、RTX4080はRTX4090の6割くらいのCUDAコア数ですから、性能はかなり落ちると思われます。
ここもRTX4000シリーズの評価を難しくしている点だと思います。
シェアがここまでワンサイドに傾いていなければ、Radeonが復活するかもしれないと書けますが、現在のGeforce一強状態でRadeonが勝つとはなかなかかけないのはちょっと残念です。
このデータを見る限り純粋に性能やコスパだけならRDNA3が圧倒的に有利です。
AMDのGPU Radeonシリーズ
Radeon 7000シリーズ
Radeon RX 6000シリーズ
※ SAPPHIREはAMD Radeon専業のメーカーであり、Radeonのリファレンス的なメーカーです。