NVIDIA GeForce RTX 4090 Ti & RTX 4090グラフィックスカードは、PCゲーム分野でこれまでにないパフォーマンスレベルをもたらす、グリーンチームの次世代フラッグシップとなりそうだ。
ここでは、スペック、価格、性能など、知っておくべきすべてを紹介する。
NVIDIA GeForce RTX 4090 Ti & RTX 4090 - 究極のゲーマーのための次世代BFGPU
[更新日-19/05/22】
NVIDIA GeForce RTX 3090シリーズは、PCグラフィックスセグメントでリードを確保するために、グリーンチームが極端な努力をすることができることを証明しました。
BFGPU」と名付けられた、新しいタイプのエンスージアストおよび究極のグラフィックスカードは、最高のパフォーマンスと最高のPCゲーミング機能を、他に類を見ないパッケージで提供します。
NVIDIAがBFGPUで目指したのは、究極のゲーマーのためだけでなく、最高のグラフィックス性能を手元に置いて、優れたビジュアルと狂気の流動性で次世代のAAAゲームタイトルを強化したいプロのコンテンツクリエーターのためのグラフィックスカードも設計することでした。
昨今、重要なのはFPSだけでなく、ビジュアルやよりスムーズなフレームレートであり、これこそGeForce RTX 3000シリーズが得意とするところです。
次世代フラッグシップでも同様のことを期待したいところですが、考慮すべき重要な要素は、GPUがよりパワフルになり、より高価になってきているということです。
これは、より良い製品を手に入れるために将来も続くかもしれない傾向ですが、その代わり、エンドユーザーには常にコストが発生します。
そこで、これまでに分かっていることから始めると、まず、次世代GeForce RTX 40シリーズカードに搭載される全く新しいAda LovelaceまたはAD10*クラスのGPUを見てみる必要があります。
NVIDIAのAD102「Ada Lovelace」GPU - 次世代パワーハウス
GPUの構成から始めて、Kopite7kimiはトップのAD102 GPUをグリーンチームの他の様々なGPUと比較しています。
ゲームに特化した「Ampere GA102」や「Turing TU102」、HPCに特化した「Hopper GH100」や「Ampere GA100」などが加えられている。
HPCに特化した設計は、コンシューマ向けの製品とは大きく異なるため、ここではAD102をゲーミング向けの製品と比較することにする。
GPUのサイズは約600mm2で、グリーンチーム向けに設計されたTSMCの5nm(N5)ノードの最適化バージョンであるTSMC 4Nプロセスノードを利用すると言われている。
NVIDIA Ada Lovelace AD102 GPUは、最大12 GPC (Graphics Processing Clusters)を搭載する予定です。
これは、GA102が7GPCしか搭載していないのに対し、70%増となる。各GPUは、6つのTPCと2つのSMで構成され、これは従来のチップと同じ構成です。
各SM(Streaming Multiprocessor)には4つのサブコアが搭載されますが、これもGA102 GPUと同じです。
変更点は、FP32とINT32のコア構成です。各サブコアには128個のFP32が搭載されるが、FP32+INT32を合わせると最大192個になる。
これは、FP32ユニットがIN32ユニットと同じサブコアを共有しないためだ。128個のFP32コアは、64個のINT32コアとは別になっている。
つまり、各サブコアは、128個のFP32ユニットと64個のINT32ユニットで構成され、合計で192個となる。
各SMは、FP32ユニット512個+INT32ユニット256個、合計768個を搭載することになる。
そして、SMは合計24基(GPCあたり2基)なので、FP32ユニット12,288基、INT32ユニット6,144基、合計18,432基のコアを持つことになる。
また、各SMには2つのWrap Schedules(32スレッド/CLK)が含まれ、SMあたり64ラップになります。
これはGA102 GPUと比較して、コア数(FP32+INT32)で50%、Wraps/Threadsで33%の増加となっています。
NVIDIA AD102「Ada Lovelace」Gaming GPU「SM」ブロック図(ソース:Kopite7kimi):
※ 画像をクリックすると別Window・タブで拡大します。
NVIDIA Ada Lovelace GPUのスペック「暫定版」:
GPU名 | AD102 | 対GA102 | 対TU102 | 対GA100 | 対GH100 |
GPC | 12 (GPU毎) | 1.7x | 2x | 1.5x | 1.5x |
TPC | 6 (GPC毎) | 同じ | 同じ | 0.75x | 0.67x |
SM | 2 (TPC毎) | 同じ | 同じ | 同じ | 同じ |
Sub-Core | 4 (SM毎) | 同じ | 同じ | 同じ | 同じ |
FP32 | 128 (SM毎) | 同じ | 2x | 2x | 同じ |
FP32+INT32 | 192 (SM毎) | 1.5x | 1.5x | 1.5x | 同じ |
ワープ | 64 (SM毎) | 1.33x | 2x | 同じ | 同じ |
スレッド | 2048 (SM毎) | 1.33x | 2x | 同じ | 同じ |
L1キャッシュ | 192 KB (SM毎) | 1.5x | 2x | 同じ | 0.75x |
L2キャッシュ | 96 MB (GPU毎) | 16x | 16x | 2.4x | 1.6x |
ROP数 | 32 (GPC毎) | 2x | 2x | 2x | 2x |
キャッシュに話を移すと、ここもNVIDIAが既存のAmpere GPUに対して大きなブーストをかけた部分である。
Ada Lovelace GPUは、SMあたり192KBのL1キャッシュを搭載し、Ampereから50%増となる。
これは、トップのAD102 GPUでは、合計4.5MBのL1キャッシュを搭載することになる。
L2キャッシュは、リークにあるように96MBに増量される。これは、6MBのL2キャッシュを搭載するAmpere GPUの16倍に相当する。
このキャッシュは、GPU全体で共有される。
最後に、ROPですが、これも1GPCあたり32個に増え、Ampereの2倍になっています。Ampereの最速GPUであるRTX 3090 Tiでは112個しかなかったROPが、次世代フラッグシップでは最大で384個になるわけです。
また、Ada Lovelace GPUには、最新の第4世代Tensorコアと第3世代RT(Raytracing)コアが搭載されており、DLSSとRaytracingのパフォーマンスを次のレベルに引き上げるのに役立ちます。
Ada Lovelace AD102 GPUは、全体として以下のような特徴を備えています。
- 2倍速GPC(対Ampere比)
- 50%増のコア数(対Ampere比)
- 50%増のL1キャッシュ対Ampere比)
- 16倍のL2キャッシュ(対Ampere比)
- ダブルザROPs(対Ampere比)
- 第4世代Tensorコアと第3世代RTコア
なお、2~3GHzとされるクロックは考慮されていないため、Ampereに対するコア単位の性能向上にも大きな役割を果たすことになる。
NVIDIA GeForce RTX 4000シリーズ グラフィックカードラインアップ(噂):
グラフィック カード | GPU | PCBモデル | SMユニット 数 / コア数 | メモリ容量 ・バス幅 | メモリ クロック 帯域幅 | TGP | 補助電源 コネクタ |
NVIDIA GeForce RTX 4090 Ti | AD102-350? | 不明 | 144 / 18432? | 48 GB / 384-bit | 24 Gbps / 1.15 TB/s | ~600W | 16-pin x1 |
NVIDIA GeForce RTX 4090 | AD102-300? | PG137/139 SKU330 | 126 / 16128? | 24 GB / 384-bit | 21 Gbps / 1.00 TB/s | ~450W | 16-pin x1 |
NVIDIA GeForce RTX 4080 | AD103-300? | 不明 | >84 / 10752? | 16 GB / 256-bit | 21 Gbps / 672 GB/s | ~350W | 16-pin x1 |
NVIDIA GeForce RTX 4070 | AD104-400? | PG141-310 SKU341 | >60 / 7680 | 12 GB / 192-bit | 18 Gbps / 432 GB/s | ~300W | 16-pin x1 |
NVIDIA GeForce RTX 4090 Ti & RTX 4090グラフィックスカードの仕様
NVIDIA GeForce RTX 4090 Ti & RTX 4090は、上記で詳細を説明したトップAD102 GPUを搭載した2チップのみとなる見込みです。
RTX 3090 TiとRTX 3090で見たように、どちらも同じチップの異なるSKUを搭載することになる。
NVIDIA GeForce RTX 4090 Tiの「予想される」スペック
NVIDIA GeForce RTX 4090 Tiは、144個のSMをすべて有効にしたフルファット構成で、合計18432個のCUDAコアが搭載される予定です。
96MBのL2キャッシュと合計384のROPsを搭載しており、まさに狂気の沙汰と言えるでしょう。
クロックはまだ確定していませんが、TSMC 4Nプロセスを採用していることから、2.0~3.0GHzのクロックが予想されます。
メモリのスペックについては、GeForce RTX 4090 Tiは、384-bitバスインターフェイスでより高速な24Gbpsの速度で来るかもしれない24GB GDDR6Xの容量が期待されています。
これは、最大1.152 TB/sの帯域幅を提供することになります。
このようにスペックが向上すると、消費電力も高くなり、このフラッグシップモデルは、約600WのTBPで動作すると予想されます。
600Wの場合、16ピンのGen 5コネクタ1つで十分ですが、AIBは必ずしも仕様内に収まらないため、ほとんどのカスタムモデルは間違いなくデュアルGen 5コネクタを利用することになるでしょうし、わずかなファクトリーオーバークロックでもTBPは600W以上になり、シングルGen 5電源コネクタの限界となります。
また、NVIDIA GeForce RTX 4090 Tiのヒートシンクとクーラーシュラウドの疑惑も確認されており、全体的に大きな構造とともにGPUとメモリダイの両方をカバーする、より頑丈なコールドプレートの使用をほのめかしています。
リークされたクーラーはFounders Editionのデザインで、その大きさから判断すると、AIBモデルは大幅に大きくなり、すべてのパートナーからクアッドスロットデザインが登場することになるかもしれませんね。
NVIDIA GeForce RTX 4090 Tiの「予想される」スペック
NVIDIA GeForce RTX 4090は、126個のSMを有効にして、合計16128個のCUDAコアを搭載したカットダウン構成になる予定だ。
GPUはL2キャッシュも少し削減されるかもしれないが、GPCの数が少ないため、ROP数は間違いなく少なくなるはずだ。
クロックについては、非Tiモデルは若干低下しますが、それでもRTX 3090 Tiに対して十分な速度になることが予想されます。
メモリに関しては、GeForce RTX 4090も24GBのGDDR6Xを搭載する見込みだが、384bitバスインターフェイスで21Gbpsの速度で動作する。
これにより、最大で1.008TB/sの帯域幅が得られることになる。
Tiモデルとの比較では、非Tiは既存のRTX 3090 Tiグラフィックスカードと同じ450Wとやや低下したTGPが搭載される予定だ。
GeForce RTX 4090グラフィックスカードのクーラーとPCBを設計する上で、RTX 3090 TiはAIBにとって学習曲線だったようです。
だから、私たちも似たようなクーラーを使うことになるかもしれません。
NVIDIA GeForce RTX 4090 TiとRTX 4090グラフィックスカードは、最新の第4世代テンソルコア、第3世代RTコア、最新のNVENCエンコーダ、NVCDECデコーダ、最新のAPIへのサポートなど、最新のNV機能セットをすべて搭載しています。
また、DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCのサポートなど、最新のRTX機能をすべて搭載しています。
NVIDIA GeForce RTX 4090 Ti & RTX 4090「速報版」スペック:
グラフィック カード名 | NVIDIA GeForce RTX 4090 Ti | NVIDIA GeForce RTX 4090 | NVIDIA GeForce RTX 3090 Ti | NVIDIA GeForce RTX 3090 |
GPU名 | Ada Lovelace AD102-350? | Ada Lovelace AD102-300? | Ampere GA102-350 | Ampere GA102-300 |
製造プロセス | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
ダイサイズ | ~600mm2 | ~600mm2 | 628.4mm2 | 628.4mm2 |
トランジスタ数 | 不明 | 不明 | 280億 | 280億 |
CUDAコア数 | 18432 | 16128 | 10752 | 10496 |
TMU数 / ROP数 | 不明 / 384 | 不明 / 384 | 336 / 112 | 328 / 112 |
Tensor / RT コア数 | 不明 / 不明 | 不明 / 不明 | 336 / 84 | 328 / 82 |
ベースクロック | 不明 | 不明 | 1560 MHz | 1400 MHz |
ブーストクロック | ~2800 MHz | ~2600 MHz | 1860 MHz | 1700 MHz |
FP32演算性能 | ~103 TFLOPs | ~90 TFLOPs | 40 TFLOPs | 36 TFLOPs |
RT TFLOPs | 不明 | 74 TFLOPs | 69 TFLOPs | |
Tensor-TOPs | 不明 | 不明 | 320 TOPs | 285 TOPs |
メモリ容量 | 24 GB GDDR6X | 24 GB GDDR6X | 24 GB GDDR6X | 24 GB GDDR6X |
メモリバス幅 | 384-bit | 384-bit | 384-bit | 384-bit |
メモリ速度 | 24.0 Gbps | 21.0 Gbps | 21.0 Gbps | 19.5 Gbps |
メモリ帯域幅 | 1152 GB/s | 1008 GB/s | 1008 GB/s | 936 Gbps |
TGP | 600W | 450W | 450W | 350W |
価格 (希望小売価格 / FE) | $1999 US? | $1499 US? | $1999 US | $1499 US |
発売時期 | 2022/07? | 2022/07? | 2022/03/29 | 2020/09/24 |
NVIDIA GeForce RTX 4090 Ti & RTX 4090グラフィックスカードの性能
これらのモンスターGPUの性能については、発売が少し先なので、ここでは理論上の数字しか使えませんが、わかっていることに基づいて、RTX 4090シリーズのカードは、100 TFLOPsの演算馬力の制限に達する最初のゲームカードとなるかもしれません。
あくまで比較のため:
- NVIDIA GeForce RTX 4090 Ti:~103 TFLOPs (FP32) (2.8GHzクロックと仮定)
- NVIDIA GeForce RTX 4090:~90TFLOPs(FP32)(2.8GHzクロックと場合)
- NVIDIA GeForce RTX 3090 Ti:40TFLOPs(FP32)(1.86GHzブーストクロック)
- NVIDIA GeForce RTX 3090:36TFLOPs(FP32)(1.69GHzブーストクロック)
2.8GHzの理論クロックに基づくと、最大103TFLOPsの演算性能が得られ、噂ではさらに高いブーストクロックが示唆されています。
これは、AMDのピーク周波数が平均的な「ゲーム」クロックよりも高いのと同様、ピーククロックのように聞こえるのは間違いない。100TFLOPs以上の演算性能は、3090 Tiフラッグシップに対して2倍以上の馬力を意味する。
しかし、演算性能は必ずしもゲーム全体の性能を示すものではないことを念頭に置く必要がありますが、それにもかかわらず、ゲーミングPCにとっては大きなアップグレードとなり、現在の最速コンソールであるXboxシリーズXの8.5倍となるのです。
これは、各グラフィックスカードが前モデルに対して2倍の演算性能の向上を実現することになり、それぞれの部門で大きな向上が期待されるRTとTensorコアの性能は考慮されていません。
FLOPは必ずしもグラフィックスやゲーム性能を反映するものではありませんが、比較のための指標にはなります。
RTX 3090 と RTX 3090 Ti に対して 2-2.5 倍のゲインがあれば、非常に破壊的であり、NVIDIA が自社のカードの電力制限を厳しくしている理由も納得がいくでしょう。
DLSSを使えば、NVIDIAがRTX 3090シリーズのBFGPUで実現しようとしている、8K解像度での60 FPSのプレイも可能になるかもしれません。
NVIDIA GeForce RTX 4090 TI & RTX 4090グラフィックスカードの価格と入手性
さて、価格についてですが、NVIDIA GeForce RTX 3090 Ti & RTX 3090グラフィックスカードは、間違いなく、これまでで最も高価なシングルチップGPUとなります。
それぞれ1999ドルと1499ドルからで、価格は超エンターテイナーとプロフェッショナルセグメントを対象としています。
今回も、非常に高い価格が予想されますし、あちこちで多少の価格変動があることも予想されます。
グリーンチームにとっては、今の価格を維持することが賢明であり、ばかばかしいかもしれませんが、性能が良ければ巨額の現金を支払う人々もいます。
RTX 4090 TiとRTX 4090の差は、今回もずっと大きいです。NVIDIAはRTX 3090 Tiから期待したほどの反響を得られなかったようで、このカードをGPUセグメントから完全に取り除く代わりに、Ti以外のバリエーションをもっとスペックダウンすることにした可能性があります。
スペックダウンによって、RTX 3090 & RTX 3090 TiよりもRTX 4090 & RTX 4090 Tiの方が性能差が大きくなるので、今の1桁の性能アップではなく、15~20%の性能アップのために上位バリエーションを手に入れるだけの価値はあるかもしれない。
NVIDIA GeForce RTX 40シリーズグラフィックスカードは、7月中旬の発売が噂されており、我々はRTX 4090 Tiの非常に冷却性能が高いシュラウドが先にリークしているのを見てきましたが、NVIDIAはまだ非Tiバージョンを最初にリリースし、RTX 4090 Tiバージョンがかなり後で市場に出回る可能性があります。
しかし、NVIDIAが次世代のごく初期にハイエンドSKUをリリースするのは、これが初めてではないだろう。
RTX 2080 Tiフラッグシップは、その前身であるGTX 1080 Tiが初期ラインアップの発売から数カ月後に登場したにもかかわらず、他のラインアップと一緒に発売されました。
RTX 3090は、RTX 30シリーズのカードの初期ラインナップと一緒に発売されましたが、3090 Tiは1年以上遅れて登場しました。
今回、NVIDIAは最初から全ファミリーを発売し、後に中間サイクルリフレッシュを行う可能性もあるが、それはまだわからない。
NVIDIA GeForce GPUのセグメント/ティア価格
グラフィック セグメント | 2014-2016 | 2016-2017 | 2017-2018 | 2018-2019 | 2019-2020 | 2020-2021 | 2021-2022 |
Titan クラス | Titan X (Maxwell) | Titan X (Pascal) | Titan Xp (Pascal) | Titan V (Volta) | Titan RTX (Turing) | GeForce RTX 3090 | GeForce RTX 3090 Ti GeForce RTX 3090 |
価格 | $999 US | $1199 US | $1199 US | $2999 US | $2499 US | $1499 US | $1999 US $1499 US |
ウルトラ エンスージアスト クラス | GeForce GTX 980 Ti | GeForce GTX 980 Ti | GeForce GTX 1080 Ti | GeForce RTX 2080 Ti | GeForce RTX 2080 Ti | GeForce RTX 3080 Ti | GeForce RTX 3080 Ti |
価格 | $649 US | $649 US | $699 US | $999 US | $999 US | $1199 US | $1199 US |
エンスージアスト クラス | GeForce GTX 980 | GeForce GTX 1080 | GeForce GTX 1080 | GeForce RTX 2080 | GeForce RTX 2080 SUPER | GeForce RTX 3080 10 GB | GeForce RTX 3080 12 GB |
価格 | $549 US | $549 US | $549 US | $699 US | $699 US | $699 US | $999 US |
ハイエンド クラス | GeForce GTX 970 | GeForce GTX 1070 | GeForce GTX 1070 | GeForce RTX 2070 | GeForce RTX 2070 SUPER | GeForce RTX 3070 Ti GeForce RTX 3070 | GeForce RTX 3070 Ti 16 GB |
価格 | $329 US | $379 US | $379 US | $499 US | $499 US | $599 $499 | 未確認 |
メインストリーム クラス | GeForce GTX 960 | GeForce GTX 1060 | GeForce GTX 1060 | GeForce GTX 1060 | GeForce RTX 2060 SUPER GeForce RTX 2060 GeForce GTX 1660 Ti GeForce GTX 1660 SUPER GeForce GTX 1660 | GeForce RTX 3060 Ti GeForce RTX 3060 12 GB | GeForce RTX 3060 Ti GeForce RTX 3060 12 GB |
価格 | $199 US | $249 US | $249 US | $249 US | $399 US $349 US $279 US $229 US $219 US | $399 US $329 US | $399 US $329 US |
エントリー クラス | GTX 750 Ti GTX 750 | GTX 950 | GTX 1050 Ti GTX 1050 | GTX 1050 Ti GTX 1050 | GTX 1650 SUPER GTX 1650 | GTX 1650 SUPER GTX 1650 | RTX 3050 |
価格 | $149 US $119 US | $149 US | $139 US $109 US | $139 US $109 US | $159 US $149 US | $159 US $149 US | $249 US |
解説:
発売間近に迫り、トーンダウンするRTX4090/Ti
少し前まで、RTX4090Tiが900W、RTX4090が600Wと言われていたTBPですが、どうもRTX4090Tiが600W、RTX4090が450Wにそれぞれトーンダウンしたようです。
もっとも、これは公式での話で、AIBのカスタムOCモデルに関してはその限りではありません。
特にRTX4090Tiは900Wまで達するかどうかわかりませんが、700Wくらいまでは普通に消費するモデルが出るのではないかと思っています。
価格に関して
価格に関しては、高くなると言われています。
仮にTBPが同じRTX3090TiとRTX4090が同じとすると、日本円で30万円前後となり、RTX4090Tiがそれ以上(40-50万円程度?)と、普通の人が気軽に買える価格ではなくなります。
私としては、AmpereのラインナップのRTX3080のように、RTX4080の価格が突然安くなってくれるのかどうかと言うのが気になります。
そうでなければ今回のAda Lovelaceは非常に購入しにくい価格になるということになります。
確かに素晴らしいのは理解できますが、コスト当たりの性能に置き換えるとさほどでもないということになろうかと思います。
それは実際の製品が出てから、各メディアがレビューすることになると思います。
発売時期、順番
元記事にもある通り、私はRTX4090/RTX4080がほぼ同時期で、RTX4090Tiは遅くなる(2022年末-2023年頭)と思っています。
理由はAD102の状態の良いシリコンをそこそこ貯めてから生産しないと初期の需要に対応できないと思うからです。
ダイサイズが600mm2を超えると言われていますので歩留まりもそれなりでしょう。
ただ、私の予想通りの価格(40-50万円)だとすると、それほど購入できる層が多いとも思えませんが・・・。
RTX4090の性能に近いRT4080Tiが予定されているのであれば出来るだけ早く出てほしいところです。
Lovelace世代を持って、普通の人が気軽に上位モデルを買える世代ではなくなるということになります。
数年後はみんな普通に内蔵GPUでゲームをしているかもしれませんね。
性能に関して
RTX4090Tiが103TFLOPS、RTX4090が90TFLOPSとFP32演算性能に関してはかなりの性能アップになります。
AMDのRadeon RX7900XTのトーンダウン後(12288SP)のFP32演算性能が70TFLOPS程度ですから、文句なくGeforceが性能面で勝つということになるでしょう。
RDNA2の時はインフィニティキャッシュが存在したため、FP32演算性能が低くてもゲーム性能は高かったのですが、Lovelaceもインフィニティキャッシュによく似た大容量のL2を搭載しますので、RDNA2とAmpereの時のような関係にはならないと私は考えています。
nVidia RTX4000SUPER
nVidia RTX4000
nVidia RTX3000シリーズGPU
RTX3060 12GB GDDR6
RTX3050 6GB