GB202は192個のストリーミング・マルチプロセッサを搭載
NVIDIAのリーカーとして最も信頼されているKopite7kimiが、BlackwellフラッグシップゲーミングGPUの詳細を語る準備が整った。
Kopiteによると、GB100 BlackwellデータセンターGPUは、8つのSM(ストリーミング・マルチプロセッサ)それぞれに10個のTPC(テクスチャ・プロセッシング・クラスタ)を利用するように設定されている。
この構成は、NVIDIAがこれらのTPC内のCUDAレイアウトを変更することを決定しない限り、GH100(8×9)よりも総コア数が増加することを示唆しています。
さらに注目すべきは、GB202 GPUの構成に関する詳細も示唆されていることで、これまでのリーク情報と同様に、それぞれ8つのTPCを持つ12個のSMを搭載し、合計192個のSMを実現すると伝えられています。
明確にするために、GB1XX GPUファミリーがデータセンター向けに設計されているのに対し、GB2XXシリーズは明確にゲームおよび潜在的にワークステーションアプリケーションを対象としています。
GB2XXシリーズは、NVIDIAの次世代ゲーミング体験を提供する。
残念ながら、TensorコアとRTコアの設計に関する情報は、現時点では開示されていません。
https://twitter.com/kopite7kimi/status/1707412339530809647?ref_src=twsrc%5Etfw
この192のSMセットアップは、今後変更がない限り、24,576のCUDAコアに相当する。
これは、現在RTX 4000シリーズのフラッグシップとして使用されているAD102 Ada Lovelace GPUと比較すると、1/3という注目に値する増加である。
しかし、現在のところ、RTX 4090 Tiが発表される兆しがないため、NVIDIAは144のSM数をゲーム用途に完全に活用するには至っていない。
さらに重要な点として、Kopiteは、GB202 GPUに512ビットのメモリバスが搭載されるという以前の噂を再確認している。
この構成がRTX 5090では採用されない可能性があることは注目に値する。
RTX 5000シリーズが本当にGDDR7メモリ技術を採用していると仮定すれば、当然ながらメモリ帯域幅が大幅に向上することになる。
https://twitter.com/kopite7kimi/status/1707419324032631217?ref_src=twsrc%5Etfw
nVIDIAのロードマップによると、Ada Lovelace後継機は2025年に発売される予定だが、もっと早いかもしれないという噂もある。
RTX 5090 GPUの正確な構成は、もちろん、この早い時期に知ることは不可能である。
さらに、他のリーカーによれば、NVIDIA GB202はまだテープアウトしておらず、代わりにまだ選ばれる可能性のある亜種があるという。
しかし、Kopiteからの実績と自信を考えると、NVIDIAは、次世代フラッグシップゲーミングGPUの仕様の最終決定に向かっている。
nVIDIA・Blackwellの噂(GB202)
NVIDIA GB202 | NVIDIA AD102 | |
アーキテクチャー | Blackwell | Ada Lovelace |
GPC数 | 12 | 12 |
TPC数 | 96 | 72 |
合計SM数 | 192 | 144 |
CUDAコア数(想定) | 24,567 | 18,432 |
ブーストクロック | ~2.9 GHz | 2.5 GHz |
メモリ容量・種類 | ~32 GB GDDR7 | 24 GB GDDR6X |
メモリバス幅 | 512-bit | 384-bit |
L2キャッシュ | ~128MB | 72MB |
デフォルト TGP |
? | 450W |
希望小売価格 | ? | 1599 USD |
発売日 | 2024-2025 | 2022/10/12 |
解説:
RTX5000シリーズの情報が出てきました。
GB202は24,567CUDAになるようです。
AD102のフルシリコンは18,432ですが、RTX4090で有効にされているCUDAは16,384です。
これを参考にすると、RTX5090のCUDAは21,837と言うことになります。もっとキリの良い数字(21,824?)になるとは思いますが、おおよそこのくらいに数になると考えておいてよいでしょう。
RTX4000シリーズの製造に使われているのはTSMC5nmの改良のTSMC4Nです。
4Nと名前が付いていますが基本的には5nmです。
TMSC5nmとTSMC3nmの間には半導体密度に埋められない差があるので、1.33倍程度にしかCUDAコアが増えないのはちょっと残念な感じがします。
しかし、その分RTコアとTensorコアが強化されるのかもしれません。
DLSS3のフレームジェネレーション以降、最近のGPUはAI/ML周りのソフトウェアが性能を決めるようになっており、それに付随してTensorコアのようなニューラルエンジンの性能の重要性が増しています。
恐らく、次世代ではTensorコアの性能が徹底的に強化されるのではないかと私は考えています。
一般のPCゲーマーやコンシュマーのインフルエンサークラスの人が実感するのは恐らくSwitch2が出た後だと思います。
実際に触れてみないとやはり実感も納得も出来ないでしょうから。