GPU情報

kopite7kimi "によると、NVIDIA GeForce RTX 50 "GB202 "GPUは192個のSMと512ビットのメモリバスを搭載すると噂されている。

投稿日:

GB202は192個のストリーミング・マルチプロセッサを搭載

NVIDIAのリーカーとして最も信頼されているKopite7kimiが、BlackwellフラッグシップゲーミングGPUの詳細を語る準備が整った。

Kopiteによると、GB100 BlackwellデータセンターGPUは、8つのSM(ストリーミング・マルチプロセッサ)それぞれに10個のTPC(テクスチャ・プロセッシング・クラスタ)を利用するように設定されている。

この構成は、NVIDIAがこれらのTPC内のCUDAレイアウトを変更することを決定しない限り、GH100(8×9)よりも総コア数が増加することを示唆しています。

さらに注目すべきは、GB202 GPUの構成に関する詳細も示唆されていることで、これまでのリーク情報と同様に、それぞれ8つのTPCを持つ12個のSMを搭載し、合計192個のSMを実現すると伝えられています。

明確にするために、GB1XX GPUファミリーがデータセンター向けに設計されているのに対し、GB2XXシリーズは明確にゲームおよび潜在的にワークステーションアプリケーションを対象としています。

GB2XXシリーズは、NVIDIAの次世代ゲーミング体験を提供する。

残念ながら、TensorコアとRTコアの設計に関する情報は、現時点では開示されていません。

 

この192のSMセットアップは、今後変更がない限り、24,576のCUDAコアに相当する。

これは、現在RTX 4000シリーズのフラッグシップとして使用されているAD102 Ada Lovelace GPUと比較すると、1/3という注目に値する増加である。

しかし、現在のところ、RTX 4090 Tiが発表される兆しがないため、NVIDIAは144のSM数をゲーム用途に完全に活用するには至っていない。

さらに重要な点として、Kopiteは、GB202 GPUに512ビットのメモリバスが搭載されるという以前の噂を再確認している。

この構成がRTX 5090では採用されない可能性があることは注目に値する。

RTX 5000シリーズが本当にGDDR7メモリ技術を採用していると仮定すれば、当然ながらメモリ帯域幅が大幅に向上することになる。

nVIDIAのロードマップによると、Ada Lovelace後継機は2025年に発売される予定だが、もっと早いかもしれないという噂もある。

RTX 5090 GPUの正確な構成は、もちろん、この早い時期に知ることは不可能である。

さらに、他のリーカーによれば、NVIDIA GB202はまだテープアウトしておらず、代わりにまだ選ばれる可能性のある亜種があるという。

しかし、Kopiteからの実績と自信を考えると、NVIDIAは、次世代フラッグシップゲーミングGPUの仕様の最終決定に向かっている。

nVIDIA・Blackwellの噂(GB202)

NVIDIA GB202NVIDIA AD102
アーキテクチャーBlackwellAda Lovelace
GPC数1212
TPC数9672
合計SM数192144
CUDAコア数(想定)24,56718,432
ブーストクロック ~2.9 GHz 2.5 GHz
メモリ容量・種類 ~32 GB GDDR7 24 GB GDDR6X
メモリバス幅 512-bit 384-bit
L2キャッシュ ~128MB 72MB
デフォルト
TGP
? 450W
希望小売価格? 1599 USD
発売日2024-20252022/10/12

ソース:Videocardz.com - NVIDIA GeForce RTX 50 “GB202” GPU rumored to feature 192 SMs and 512-bit memory bus, according to “kopite7kimi”

 

 

 

 

解説:

RTX5000シリーズの情報が出てきました。

GB202は24,567CUDAになるようです。

AD102のフルシリコンは18,432ですが、RTX4090で有効にされているCUDAは16,384です。

これを参考にすると、RTX5090のCUDAは21,837と言うことになります。もっとキリの良い数字(21,824?)になるとは思いますが、おおよそこのくらいに数になると考えておいてよいでしょう。

RTX4000シリーズの製造に使われているのはTSMC5nmの改良のTSMC4Nです。

4Nと名前が付いていますが基本的には5nmです。

TMSC5nmとTSMC3nmの間には半導体密度に埋められない差があるので、1.33倍程度にしかCUDAコアが増えないのはちょっと残念な感じがします。

しかし、その分RTコアとTensorコアが強化されるのかもしれません。

DLSS3のフレームジェネレーション以降、最近のGPUはAI/ML周りのソフトウェアが性能を決めるようになっており、それに付随してTensorコアのようなニューラルエンジンの性能の重要性が増しています。

恐らく、次世代ではTensorコアの性能が徹底的に強化されるのではないかと私は考えています。

一般のPCゲーマーやコンシュマーのインフルエンサークラスの人が実感するのは恐らくSwitch2が出た後だと思います。

実際に触れてみないとやはり実感も納得も出来ないでしょうから。

 

 

 

nVidia RTX4000SUPER

 

nVidia RTX4000

 

nVidia RTX3000シリーズGPU

RTX3060 12GB GDDR6

 

RTX3050 6GB

-GPU情報
-,

Copyright© 自作ユーザーが解説するゲーミングPCガイド , 2024 All Rights Reserved.