NVIDIAのGeForce RTX 5090フラッグシップGPUは、巨大でモノリシックなGB202 "Blackwell "ダイを搭載するとKopite7kimiが報じている。
NVIDIAのGeForce RTX 5090フラッグシップGPUはモノリシックGB202 "Blackwell "ダイを搭載するが、ひねりがあるかもしれない
これまでに判明している情報によると、NVIDIA GB202 "Blackwell" GPUは、フラッグシップのGeForce RTX 5090グラフィックスカードに搭載される予定だ。
リークされた仕様では、チップがAD102「Ada」チップのSMあたり128コアの設計を維持する場合、最大192個のSMが最大24,567個のCUDAコアを占めることが明らかになっています。
現在、インサイダーであるKopite7kimiの新しいツイートから、このGPUはモノリシック設計を採用することが明らかになっている。
https://x.com/kopite7kimi/status/1793677941576253464?ref_src=twsrc%5Etfw
NVIDIAはB100やB200のようなHPC/AIチップではチップレット設計にシフトしているが、コンシューマー向けGPUダイではモノリシックパッケージを維持したいと考えているようだ。
GB202 "Blackwell "GPUは物理的にモノリシック設計になると言われており、以前の報道から、GeForce RTX 5080のような、よりカットダウンされたダイであるGB203の2倍の数のSMとコアを搭載すると予想されていることが分かっています。
これは、2枚のカードの性能に大きな性能差を生むが、RTX 5090は完全な怪物になるようだ。
NVIDIA GeForce RTX 5090についてはもう少し詳しく説明するが、その前にGB202「Blackwell」GPU自体についてもう少し話そう。
つまり、モノリシック設計のようだが、隠された下にチップレット風の設計がある可能性も否定できない。
NVIDIAは、チップレットデザインのように見せかけることなく、実質的にモノリシックパッケージに2つのGB203ダイを搭載しているのかもしれません。
これにより、適切なチップレット実装に関連するオフダイ通信のボトルネックではなく、より優れたダイ間通信が可能になります。
NVIDIAには、NVLINKやその他のインターコネクトなど、ボトルネックを克服するためのソリューションがありますが、GPUの複雑さが増すため、少し高価になるかもしれません。
https://x.com/ctnzr/status/1769852326570037424?ref_src=twsrc%5Etfw
NVIDIAは、GA100とGH100という形ですでに市場に出ているソリューションを持っているが、これは基本的に、インターコネクトで接続され、分割されたL2キャッシュを介して通信する、より小さなダイの2つの半分である。
NVIDIAのBryan Catanzaro氏は、この実装によりスケーラビリティが向上し、この設計への最初の移行はスムーズに進んだと説明している。
このチップはまた、密度を30%向上させるTSMC 4NPプロセスノード(5nm)をベースとする予定である。
現在、NVIDIAはおそらくゲーム製品でも同じことをするつもりであり、全体がうまくいけば、将来的にはB100/B200スタイルのチップレットが登場することになるだろう。
さて、NVIDIA GeForce RTX 5090に話を戻すと、次世代フラッグシップに512ビット・インターフェイスが搭載されるかもしれないという複数の報告があり、このモンスター・カードのために、まったく新しい冷却とPCBソリューションに関する情報がすでに発表されている。
AMDがRDNA 4ラインナップで超ハイエンドグラフィックス性能セグメントから手を引くという噂を考えると、NVIDIAはBlackwell GPUが発売されれば、ゲーミングセグメントでさらにリードを広げるかもしれない。
NVIDIA GeForce RTX 5090は、店頭に並ぶ最初のBlackwellゲーミングGPUになると噂されているRTX 5080とは別に、数週間後に発売されると予想されている。
NVIDIA Blackwell「GB202」GPUの「暫定的」なスペック:
GPU 名 | GB202 | AD102 |
GPC | 12 (GPU毎)? | 12 (GPU毎) |
TPC | 8 (GPC毎)? | 6 (GPC毎) |
SM | 2 (TPC毎)? | 2 (TPC毎) |
合計SM数 | 192? | 144 |
サブコア数 | 不明 | 4 (Per SM) |
FP32 | 128 (SM毎)? | 128 (SM毎) |
FP32+INT32 | 不明 | 128 (SM毎) |
CUDAコア数 | 24,567? | 18432 |
Warp数 | 不明 | 64 (SM毎) |
Thread数 | 不明 | 2048 (SM毎) |
L1 キャッシュ | 不明 | 192 KB (SM毎) |
L2 キャッシュ | 不明 | 96 MB (Per GPU) |
ROP数 | 不明 | 32 (GPC毎) |
標準搭載メモリ | GDDR7 | GDDR6X |
最大メモリバス幅 | 512-bit | 384-bit |
最大メモリ容量 | 48 GB? | 24 GB |
ソース:wccftech - NVIDIA GeForce RTX 5090 GPU To Feature A Massive Monolithic GB202 “Blackwell” Die
解説:
RTX5090に搭載されるGB202はモノリシックになる。
GB202=GB203X2と言われていましたが、どうもモノリシックになるようです。
チップ間通信の問題が解決できなかったか、CoWoSの容量を全部サーバー製品に回してしまったかのいずれかだと思いますが、B100でMCMを採用していますので、おそらく後者だと思います。
実質的にモノリシックパッケージに2つのGB203ダイを搭載
これはMCMだと思うのですが、何かいまいちよくわからないことを書いていますね。
kopite7kimi 氏は
physically monolithic
と書いているのでそうなのだと思います。
2つのGB203を使っているならばMCM、一つのダイならモノリシック、これ以外はあり得ないと思います。
オンパッケージに2つのダイを搭載しているのならMCMだと思っていたのですが違うのでしょうか。
モノリシックになるならばGB203のRTX5080を先に発売する理由が今一つ分かりませんねぇ。
nVidia RTX4000SUPER
nVidia RTX4000
nVidia RTX3000シリーズGPU
RTX3060 12GB GDDR6
RTX3050 6GB