NVIDIAの次世代ゲーミンググラフィックスカード「GeForce RTX 4090」は、「RTX 3090」の2倍以上の速度になると噂されており、「RTX 4080」はスペックアップが行われる可能性があるようです。
NVIDIA GeForce RTX 4090グラフィックスカードはRTX 3090の2倍以上の速度、RTX 4080はスペックアップを受けるとの噂がある。
最新の情報はKopite7kimi氏によって共有され、NVIDIA GeForce RTX 4090グラフィックカードのスペックは以前投稿したものと同じだが、カードの全体的なパフォーマンスは驚異的に向上し、既存のRTX 3090巨体に対して2倍以上になっていると述べている。
この性能は純粋なラスタライゼーションなので、ゲーム内の全体的なパフォーマンスは異なるはずですが、それでも前世代が提供していたものと比べて大きな飛躍と言えます。
また、NVIDIAは、箱から出して最大450-500WのTDPを特徴とすることが予想されるカードについて話しているので、TDPの上昇を有効に利用していることを意味します。
https://twitter.com/kopite7kimi/status/1533803858337878017?ref_src=twsrc%5Etfw
さらに重要なのは、NVIDIA GeForce RTX 4090は、カットダウンされたAD102「Ada Lovelace」GPUコアを搭載すると言われており、これはフルバリエーション、おそらくTitanまたはRTX 4090 TiがRTX 3090よりはるかに高い性能で終わる可能性があるということだ。
RTX 3090 Tiよりも70%以上のCUDAコアに加え、TSMC 4Nプロセスノードへの移行により、現行世代よりも大幅に向上すると噂されるクロックスピードを考慮すると、この上昇も期待できるはずだ。
また、既存のフラッグシップGPUのL2キャッシュがわずか6MBであるのに対し、96MBの豊富なL2キャッシュを含む新しいアーキテクチャによって、大きな性能向上を得ることができます。
GeForce RTX 4090の他に、Kopite7kimiはNVIDIA GeForce RTX 4080がスペックアップされるとしています。
以前、このグラフィックスカードは350WのTBPを搭載すると噂されていたが、現在は420Wに変更されており、RTX 3090よりも高いボードパワーの数値になっている。GeForce RTX 4080は、依然としてAD104 GPUを少し最適化したAD103 GPUを利用するようだ。
これは、既存のRTX 3080よりも100W高いTDPを意味するので、このカードは本当に速いスペックで終わる可能性があります。
https://twitter.com/kopite7kimi/status/1533782031670603777?ref_src=twsrc%5Etfw
また、先日お伝えしたNVIDIA GeForce RTX 4060のTGPは220Wで、こちらも前モデルを大きく上回っている。
というわけで、ラインナップ全体を見ると、Ada Lovelaceがボンヤリするようなパワーの数値が期待できるが、同時に、大規模な性能向上も期待できるのである。
NVIDIA GeForce RTX 4090 Tiの「予想される」スペック
NVIDIA GeForce RTX 4090 Tiは、144個のSMをすべて有効にして、合計18432個のCUDAコアを搭載したフルファット構成となる予定です。96MBのL2キャッシュと合計384のROPsを搭載しており、まさに狂気の沙汰と言えるでしょう。
クロックはまだ確定していませんが、TSMC 4Nプロセスが採用されていることから、2.0~3.0GHzのクロックが予想されます。
メモリのスペックについては、GeForce RTX 4090 Tiは、384-bitバスインターフェイスでより高速な24Gbpsの速度で来るかもしれない24GB GDDR6Xの容量を揺さぶることが期待されている。
これは、最大1.152 TB/sの帯域幅を提供することになります。このようにスペックが向上すると、消費電力も高くなり、このフラッグシップモデルは、約600WのTBPで動作すると予想されます。
600Wの場合、16ピンのGen 5コネクタ1つで十分ですが、AIBは必ずしも仕様内に収まらないため、ほとんどのカスタムモデルは間違いなくデュアルGen 5コネクタを利用することになるでしょうし、わずかなファクトリー・オーバークロックでもTBPは600W以上になり、シングルGen 5電源コネクタの限界となります。
また、NVIDIA GeForce RTX 4090 Tiのヒートシンクとクーラーシュラウドの疑惑も確認されており、全体的に大きな構造とともにGPUとメモリダイの両方をカバーする、より頑丈なコールドプレートの使用をほのめかしています。
リークされたクーラーはFounders Editionのデザインで、その大きさから判断すると、AIBモデルは大幅に大きくなり、すべてのパートナーからクアッドスロットデザインが登場することになるかもしれませんね。
NVIDIA GeForce RTX 4080の「予想される」スペック
NVIDIA GeForce RTX 4080は、既存のGA102と同じコアで、より高い周波数で調整されたカットダウン構成になるか、または9000~1000コアの間で、将来的にフルファット構成で「Ti」バリエーションになる余地が残ると予想されています。
GPUは64MBのL2キャッシュと最大224のROPを搭載しており、まさに狂気の沙汰と言えるでしょう。
クロックはまだ確定していないが、TSMC 4Nプロセスが採用されていることを考えると、2.0~3.0GHzのクロックが予想されています。
通常より高いクロックは、Samsungの8nmノードを採用したAmpere GPUが、実際には10nmプロセスノードにいくつかの最適化を施したものだったことを考えると、NVIDIAが2ノードジャンプをしていることに由来する。
NVIDIAは、7nmをスキップして、5nmノードに直行し、バニラバリアントですらなく、その最適化バージョンにしようとしているのです。
TSMCの16nmノードのPascalで、NVIDIAは大幅な周波数の飛躍を実現しましたが、今回も同様の飛躍が期待できます。
メモリ仕様については、GeForce RTX 4080は16GB GDDR6Xを搭載し、256ビットバスインターフェースで21Gbpsの速度で動作すると予想されています。
これは、最大672GB/sの帯域幅を提供することになります。このように仕様が強化されると、消費電力も高くなり、このフラッグシップモデルは約420WのTBPで動作すると予想されます。
420Wの場合、リファレンスモデルとカスタムモデルの両方で、16ピンGen 5コネクタ1つで十分なはずです。
発売については、2022年第3四半期~第4四半期にグラフィックスカードのラインナップが予定されており、より詳細なスケジュールはこちらで確認することができる。
NVIDIA GeForce RTX 40シリーズ グラフィックカードラインアップ(噂):
グラフィックカード | GPU | PCBモデル | SMユニット 数 / コア数 |
メモリ容量 ・バス幅 |
メモリ クロック /帯域幅 |
TGP | 補助電源コネクタ | 発売時期 |
NVIDIA Titan A? |
AD102-400? | 不明 | 144 / 18432? | 48 GB / 384-bit |
24 Gbps / 1.15 TB/s |
~900W | 16-pin x 2 | 不明 |
NVIDIA GeForce RTX 4090 Ti |
AD102-350? | 不明 | 144 / 18432? | 24 GB / 384-bit |
24 Gbps / 1.15 TB/s |
~600W | 16-pin x 1 | 不明 |
NVIDIA GeForce RTX 4090 |
AD102-300? | PG137/139 SKU330 | 126 / 16128? | 24 GB / 384-bit |
21 Gbps / 1.00 TB/s |
~450W | 16-pin x 1 | 2022Q4 |
NVIDIA GeForce RTX 4080 |
AD103-300? | PG13*/139 SKU360 | >84 / 10752? | 16 GB / 256-bit |
21 Gbps / 672 GB/s |
~420W | 16-pin x 1 | 2022Q4 |
NVIDIA GeForce RTX 4070 |
AD104-400? | PG141-310 SKU341 | >60 / 7680? | 12 GB / 192-bit |
18 Gbps / 432 GB/s |
~300W | 16-pin x 1 | 2022Q4 |
NVIDIA GeForce RTX 4060 |
AD106-***? | 不明 | >36 / 4608? | 8 GB / 128-bit |
不明 | ~200W | 16-pin x 1 | 2023Q1 |
解説:
二転三転する噂
他のソースからはRTX4080はAD102のカットダウンになると予測されていますが、どうもwccftechからはRTX4080はAD103のカットダウンモデルになるという情報が入っているようです。
今回の仕様ではAD103は10752CUDAコアと予想されており、そうなるとRTX4080はもう少しCUDAコア数が少ないことになります。
これだと、AD102を採用するTitan AやRTX4090/Tiとの性能差が大きくなりすぎると思うのですが、nVidiaはAD102をそれほど多く売りつもりはないんですかね。
RTX4090が20-30万円の間だとしてもそれほど多く売れるとは思えません。
一般向けとしてはダイサイズの小さいAD103を搭載したRTX4080を売りたいと思っているならば説得力のある説です。
そうしないと思い切ったコストダウンできないのかもしれませんね。
ただし、RTX4080も420Wオーバーと書かれていますので、今までの常識からすると、かなり電力バカ食いのGPUになることは確実です。
RTX3090Tiと同程度と考えればよいのでしょうね。
未だに確定できない部分として、Ada Lovelaceシリーズのゲーム性能があります。
AmpereはTuringと比較してもFP32演算性能の割にゲーム性能がかなり低かったわけですが、これが巷で噂されている通り、ゲームエンジンが増えたCUDAコア数を使いきれてないためならゲーム性能は増えたCUDAコア数に対応しない限りは上がらないわけですが、別のところに要因があった場合、爆発的にゲーム性能が伸びるということになります。
今回は大容量L2キャッシュとアーキテクチャー自体も刷新されているわけですので、そのどちらかに問題があってボトルネックになっていたのならば、ゲーム性能が爆発的に伸びるということになります。
FP32演算性能が60-70%程度のRX6900XTと同程度のゲーム性能と言うのはいくら何でもおかしすぎると思います。
さて、実際どの程度の性能になるのかは実物が出ないとわからないことです。
レンダリングやエンコードに使われている方は割とFP32演算性能に沿った実力が発揮されていたようですので、あまり大きな変化はないと思います。