GeForce RTX 5090の噂が具体化
NVIDIAの次世代コンシューマ向けGPUラインアップに関する最初の詳細を明らかにしたChiphellリーカーが、今度は新アーキテクチャの能力に関する新たな噂を披露した。
NVIDIAが次期ゲーミング製品シリーズでXXX04クラスのGPUをスキップする予定であることを最初に明らかにしたのは、Panzerlied氏であった。
この暴露を受けて、私たちは著名なNVIDIAのインサイダーであるKopite7kimiに連絡を取り、Kopite7kimiはその後この噂を確認しました。Kopite7kimiはまた、次期NVIDIA RTX 50シリーズがGB2XXの命名規則を採用することも教えてくれました。
今日、Kopite7kimiは、NVIDIAの次世代GPUラインナップのコードネームとして機能するBlackwellシリーズに関する新たな詳細を共有しました。
現在、Blackwellはデータセンターとゲーミングの両シリーズを包含すると予想されている。
ただし、これら2つのGPUシリーズには、GB1XXがハイパフォーマンスコンピューティング(HPC)用、GB2XXがゲーミングGPU用として、それぞれ異なる命名方式が採用される。
一方、Panzerliedは、グラフィックスファンがNVIDIAの次世代ラインアップに何を期待できるかについて、いくつかの洞察を提供している。
具体的な数値を示す代わりに、PanzerliedはBlackwellファミリーのさまざまな側面における改善率を示している。
NVIDIA RTX 5090とRTX 4090の比較
- スケール50%増(推定コア数)
- メモリ帯域幅が52%増加
- キャッシュが78%増加(おそらくL2キャッシュ)
- 周波数の15%増加(おそらくGPUブースト)
- 1.7倍の向上(おそらくパフォーマンス)
Panzerliedは後にスレッドで、これらの主張はAD102ではなくRTX 4090のスペックに関するものであることを明らかにした。
21Gbpsメモリを搭載したRTX 4090が32Gbpsにアップグレード(52.4%増)されることを考慮すると、RTX 50シリーズはGDDR7テクノロジーを搭載する可能性があることを示唆している。
AD102の後継機には512ビットのメモリバスが搭載されると噂されているが、これはRTX 5090に採用されるとは限らない。
NVIDIAが初日から最速のGDDR7メモリをカードに採用する可能性は低いと思われるため、512ビット/24Gbpsや448ビット/28GbpsといったRTX 5090の構成も考えられる。
他の主張もRTX 4090を基準にしていると仮定すると、周波数が15%向上すると、ブーストクロックは2.9GHzとなり、実際のワークロードでは3.0GHz以上のクロックを達成する可能性が高い。
さらに、キャッシュが78%増加することから、GB202 GPUは128MBのL2キャッシュを搭載することになります。
次世代GeForceシリーズの発売まで1年以上ありますが、もしこれらの仕様をRTX 5090 GPUの可能性に当てはめると、次のようになります:
噂されるNVIDIA GeForce RTX 5090のスペック
GeForce RTX 4090 | GeForce RTX 5090 | 違い | |
アーキテクチャー | Ada (TSMC 4N) | Blackwell | |
GPU | AD102-300 | GB202 | |
SM数 | 128 | ~192 | 50% |
CUDAコア数 | 16K | ~24K | 50% |
ブースト クロック | 2.5 GHz | ~2.9 GHz | 15% |
メモリ | 24 GB GDDR6X | ~24 or 32 GB GDDR7 | 0 から +33% |
メモリバス幅 | 384-bit | 384 or 512-bit | 0 から +33% |
メモリ速度 | 21 Gbps | ~32 or 24 Gbps | 14% から 52% |
メモリ帯域幅 | 1 TB/s | ~1.54 TB/s | 52% |
L2 キャッシュ | 72MB | ~128MB | 78% |
デフォルトTGP | 450W | ? | |
希望小売価格 | 1599 USD | ? | |
発売日 | 2022/12/12 | 2025 |
解説:
早くもnVIDIAの次世代アーキテクチャーBlackwellの噂が出てきました。
CUDAコア数が24,000超と予測されています。
AD102のフルシリコンは約18,000なので、それを考えるとフルシリコンで27,000程度と考えた方が良いかもしれません。
総合的な性能は1.7倍、+70%となっています。
後はAI性能で稼ぐのでしょう。
DLSS4があるのかどうかわかりませんが、あるとしたら現状のDLSSよりさらに何かプラスされるものがあるのでしょう。
もはや、物理的な実装では飛躍できる性能に限界がありますので、AI性能込みの性能で表示するつもりなのでしょうね。
思えばTensorコアが初めて実装されたRTX2000シリーズのフラッグシップRTX2080Tiも実性能は13.8TFLOPSでしたが、nVIDIAは44TFLOPS以上と公称していました。
これはRTコアやDLSS込みの性能でしょう。
翻ってBalckwellもAI性能込みならば、5-10倍程度にはなるのではないかと私は考えています。
私のようにオールドタイプの人間から見ると何か狸か狐に化かされたように感じますが、ChatGPTも若い人の方がスンナリ受け入れており、大学の教授などはChatGPTを使った成果物を「ズル」・「不正」とみなしています。
このような傾向は年齢が上になればなるほど強くなるようですので、今のAIがあるのが当たり前の世代が社会の上のほうになるころにはAIを使った成果物は不正ではないというのが常識になるかもしれません。
私もROCmのセットアップスクリプトを配布している関係上、AI関連のライブラリやプログラムの進化を早さを実感しており、そろそろ考えを改めるべき時期に来ているのかなと痛感しています。
そう言う意味でROCmのセットアップスクリプトの配布は私にとって考えを時代に合わせていく良い機会になっています。
nVidia RTX4000SUPER
nVidia RTX4000
nVidia RTX3000シリーズGPU
RTX3060 12GB GDDR6
RTX3050 6GB