昨日、NVIDIAはGeForce RTX 4080 16GB & RTX 4080 12GBグラフィックカードの全く新しいゲームパフォーマンスベンチマークを公開しました。
この結果から、3つのGeForce RTX 40シリーズグラフィックスカードの間には、それぞれ大きな差があることがわかります。
NVIDIA GeForce RTX 4080 16GBはRTX 3090 Tiより最大60%高速、RTX 4080 12GBは公式ゲーミングベンチマークによると最大30%高速に
ベンチマークは3つのゲームをカバーしていますが、GeForce RTX 40シリーズのカードとRTX 30シリーズの製品との比較を見せてくれています。
私たちはすでに、GeForce RTX 4090のゲームでの性能を見てきました。
DLSSなしでほぼ2倍、DLSS 3を有効にすると最大4倍のゲインを達成していますが、NVIDIAの次期GeForce RTX 4080 16GBおよび12GBのモデルの性能に目が向けられています。
状況をまとめると
- RTX 4090 vs RTX 4080 16GB、ネイティブ4K時=50%高速
- RTX 4080 16GB vs RTX 4080 12GB、ネイティブ4K時 = 28%高速
- RTX 4080 12GBとRTX 3090 Ti、ネイティブ4K時= 11% 低速
NVIDIA GeForce RTX 4080 16GB&12GBとRTX 3090 TiのF1 2022での比較
NVIDIAが公開した性能の数字から、ネイティブとDLSS 3の両方のゲーム性能を初めて見ることができます。
4Kでレイトレーシングを有効にしたF1 2022から始めると、RTX 4080 16GBは、DLSSを無効にしたRTX 3090 Tiよりも16%速く、DLSS 3を有効にした場合は44%速いことが分かります。
RTX 4080 12GBは、ネイティブ4KでRTX 3090 Tiより6%遅く、DLSS 3を有効にすると14%速くなる。
また、RTX 4080の16GB&12GBモデルの差はかなり大きいようで、これが大きな価格差の説明になりそうだ。
F1 2022では、RTX 4080 16GBはネイティブで24%、DLSS 3を有効にすると27%高速化する。
※ 画像をクリックすると別Window・タブで拡大します。
A Plague Tale: RequiemにおけるNVIDIA GeForce RTX 4080 16GB & 12GB 対 RTX 3090 Ti
A Plague Taleに移ります。
RTX 4080 16GBは、RTX 3090 Tiより9%速く、RTX 4080 16GBは、RTオフのネイティブ4Kで同カードより16%遅いことがわかります。
DLSS 3をオンにした場合、同カードは3090 Tiよりも41%、16%高速になります。
また、NVIDIA GeForce RTX 4080 16GBは、12GBモデルと比較して、ネイティブでは全体で30%、DLSS 3を有効にした状態では21%高速化されています。
※ 画像をクリックすると別Window・タブで拡大します。
Microsoft Flight SimulatorにおけるNVIDIA GeForce RTX 4080 16GB&12GBとRTX 3090 Tiの比較
Microsoft Flight Simulatorでは、ネイティブ4K解像度において、NVIDIA GeForce RTX 4080 16GBはRTX 3090 Tiより24%速く、RTX 4080 12GBは1%遅くなりました。
DLSS 3を有効にした場合、カードは3090 Tiに対してそれぞれ94%と60%のブーストを獲得します。
再び、4080 16GBは12GBに対して、4Kネイティブで26%、DLSS有効で21%高速化されます。
※ 画像をクリックすると別Window・タブで拡大します。
NVIDIA GeForce RTX 4080 16GBの「公式」仕様について
NVIDIA GeForce RTX 4080 16GBグラフィックスカードは、従来の構成が80 SMまたは10,240コアを提供していたのに対し、合計84ユニットのうち9,728コアまたは76 SMを有効にしたカットダウンAD103-300 GPU構成を利用すると予想される。
フルGPUは64MBのL2キャッシュと最大224ROPsを搭載しているが、RTX 4080は縮小設計のため、48MBのL2キャッシュと低いROPsで終わるかもしれない。
このカードは、PG136/139-SKU360 PCBをベースとすることが予想される。
グラフィックスカードのピーククロックは2505MHzとされている。
メモリのスペックとしては、GeForce RTX 4080は16GB GDDR6Xの容量を揺り動かすと予想され、256ビットバスインターフェースで22.5Gbpsの速度で調整されると言われています。
これは、最大720GB/sの帯域幅を提供することになります。
これは、RTX 3080が320-bitインターフェイスを搭載しているものの、容量が10GBと少ないため、RTX 3080が提供する760GB/sの帯域幅よりもまだ少し遅めである。
低い帯域幅を補うために、NVIDIAは次世代メモリ圧縮スイートを統合して、256-bitインタフェースを補うことができるかもしれません。
- NVIDIA GeForce RTX 4080 16GB「公式」TBP – 320W
- NVIDIA GeForce RTX 3080 12 GB “公式 “TBP – 350W
電力については、TBPの定格電力が340Wに設定され、前回取得した320Wのスペックから20W増加した。
これにより、TBPは既存のRTX 3080グラフィックスカード(最大350W)と同程度の性能となった。なお、BIOSの最大TGPは516Wとされている。
現在、他のRTX 4000シリーズグラフィックスカードもより高速なGDDR6Xメモリが搭載されるかどうかは不明だが、Micronが最大24Gbps GDDR6Xメモリモジュールのフル量産を開始したことが分かっているので、搭載される可能性もあるかもしれない
NVIDIA GeForce RTX 4090 Tiの “噂 “のスペック:
グラフィック カード名 |
NVIDIA GeForce RTX 4090 Ti |
NVIDIA GeForce RTX 4090 |
NVIDIA GeForce RTX 4080 16G |
NVIDIA GeForce RTX 4080 12G |
NVIDIA GeForce RTX 3090 Ti |
GPU名 | Ada Lovelace AD102-400? | Ada Lovelace AD102-300 | Ada Lovelace AD103-300 | Ada Lovelace AD104-400 | Ampere GA102-225 |
製造プロセス | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N | Samsung 8nm |
ダイサイズ | 608mm2 | 608mm2 | 378.6mm2 | 294.5mm2 | 628.4mm2 |
トランジスタ数 | 760億 | 760億 | 459億 | 358億 | 280億 |
CUDAコア数 | 18,432 | 16,384 | 9,728 | 7,680 | 10,752 |
TMU数 / ROP数 |
不明 | 512 / 176 | 320 / 112 | 240 / 80 | 320 / 112 |
Tensor / RT コア数 |
不明 | 512 / 128 | 304 / 76 | 240 / 60 | 320 / 80 |
ベースクロック | 不明 | 2230 MHz | 2210 MHz | 2310 MHz | 1365 MHz |
ブーストクロック | 2710 MHz | 2520 MHz | 2510 MHz | 2610 MHz | 1665 MHz |
FP32演算性能 | 100 TFLOPs | 83 TFLOPs | 49 TFLOPs | 40 TFLOPs | 40 TFLOPs |
RT TFLOPs | 不明 | 191 TFLOPs | 113 TFLOPs | 82 TFLOPs | 78 TFLOPs |
Tensor-TOPs | 不明 | 1321 TOPs | 780 TOPs | 641 TOPs | 320 TOPs |
メモリ容量 ・種類 |
24 GB GDDR6X | 24 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 24 GB GDDR6X |
メモリバス幅 | 384-bit | 384-bit | 256-bit | 192-bit | 384-bit |
メモリ速度 | 24.0 Gbps | 21.0 Gbps | 23.0 Gbps | 21.0 Gbps | 21 Gbps |
メモリ帯域幅 | 1152 GB/s | 1008 GB/s | 736 GB/s | 504 GB/s | 1,008Gbps |
TBP | 475W | 450W | 320W | 285W | 450W |
価格 (希望小売 価格 / FE版) |
$2199 US? | $1599 US | $1199 US | $899 US | $1999 |
発売時期 | 不明 | 2022/10/12 | 2022/11 | 2022/11 | 2022/03/29 |
解説:
RTX4080の性能と価格
来月発売予定のRTX4080 16GB、12GBのベンチマークが公開されています。
DLSS3はRTX4000シリーズ専用と言うことで、旧世代のGPUに大きな差をつけています。
シェアでトップを走るnVidiaは脱共有化戦略を取ります。
旧モデルも含めた他社製品を陳腐化させるのが目的です。
シェア的に言ってAMDやIntelは今のところnVidiaの眼中にないので、最大のライバルは「自社の旧製品」と言うことになります。
新製品のマーケティングが始まると自社の旧製品への「攻撃」が始まりますので、旧モデルの在庫処分品を買うのはお勧めしてませんでしたが、こういった資料を見ると痛感するのではないかと思います。
さて、今回の話題はRTX4080です。
RTX4090、RTX4080 16GB、RTX4080 12GBのCUDAコア当たりの価格を見てみましょう。
- RTX4090/16,384/298,000
- RTX4080 16GB/9,728/219,800
- RTX4080 12GB/7,680/164,800
- RTX4090 1CUDAコア当たり18.19円
- RTX4080 16GB 1CUDAコア当たり22.59円
- RTX4080 12GB 1CUDAコア当たり21.46円
と言うことになります。
1CUDAコア当たりのコストで比べるとはっきりしますが、RTX4080はかなりコスパが悪化しているのがわかるのではないでしょうか。
比較のためにAmpereの上位モデルで一番価格が安かったRTX3080と比較してみます。
- RTX3080/8,708/109,800
- 1CUDAコア当たり12.61円
となります。
1CUDAコア当たりのコストが爆増しているのがよくわかる結果ですね。
今回はRTX4080 12GBの方がやや割安と言うことになります。
RTX4070(仮)が6144CUDAコアとすると1CUDAコア当たり22円で計算すると135,168円となります。
私は12万と予想していましたが、実売に直すと14万程度と考えた方がいいのかもしれません。
以前の記事で私が予想したRTX4060のスペックで計算すると
RTX4060(仮)/4,096CUDAコア/90,112円
と言うことになります。
同様にRTX4050でも計算してみましょう。
RTX4050(仮)/3,072CUDAコア/67,584円
と言うことになります。
RTX3050はGA107が別ダイであったにも関わらず、なぜかGA106のカットオフ版を使用していました。
GA107はモバイル向けに出していたのかもしれません。
どちらにしてもデスクトップ版ではあまり変わらないでしょう。
この価格になるとすると、Ada Lovelaceは各モデルのグレードが1-2段階上がり、ローエンドモデルが存在しないということになります。