次世代NVIDIA GeForce RTX 4090は、AD102 GPUを搭載し、100 TFLOPsを突破する最初のゲーミング・グラフィックスカードとなる可能性があります。

次世代NVIDIA GeForce RTX 4090シリーズに関する最近の噂では、AD102を搭載したグラフィックカードが100TFLOPsの壁を突破する最初のゲーミング製品になるかもしれないとのことです。

NVIDIA GeForce RTX 4090クラスのグラフィックスカードは、100TFLOPsの壁を突破する最初のゲーミング「AD102」GPUとなるかもしれない。

現在、NVIDIA GeForce RTX 3090 Tiは、すべてのゲーミンググラフィックスカードの中で最高の演算性能を発揮し、FP32（単精度）GPU演算で40～45 TFLOPsを記録しています。

しかし、今年後半に登場する次世代GPUによって、状況は大きく前進することになります。

To be honest, I don't have much information about AMD. Maybe Lisa and Jensen's competition will give us a 100TFLOPS gaming war in a few months.
— kopite7kimi (@kopite7kimi) April 29, 2022

I can only say that the two products have improved a lot compared to their predecessors, but if you want to ask me directly which one is better, I'm sorry I can't answer, because no one knows the specific improvement by percentage.
— Greymon55 (@greymon55) April 30, 2022

Kopite7kimiとGreymon55の噂によると、NVIDIAだけでなくAMDの次世代グラフィックスカードも100TFLOPsの大台に乗ると予想されているそうです。

これは、現世代のカードで大きな性能と消費電力のジャンプを見てきたコンシューマグラフィックス市場で、大きなマイルストーンとなることでしょう。

275Wが限界だったのが、350～400Wが標準になり、RTX 3090 Tiのような製品はすでに500Wを超える電力を消費しているのです。

次世代はさらに電力を消費するようになりますが、もし演算の数字が何かであれば、なぜそれだけの電力を消費するのか、その理由はすでに1つわかっているはずです。

このレポートの通り、NVIDIAのAda Lovelace GPU、特にAD102チップは、TSMCの4Nプロセスノードでいくつかの大きなブレークスルーを見せている。

以前の2.2～2.4GHzのクロックの噂と比べると、現在の推定では、AMDとNVIDIAのブースト速度は互いに似ており、2.8～3.0GHz程度になると見られる。

NVIDIAの場合は、合計18,432個のコアと96MBのL2キャッシュ、384-bitのバスインターフェイスを融合させる予定だ。

これを12GPCのダイレイアウトで、6TPC、1TPCあたり2SMの合計144SMを積層する。

2.8GHzの理論クロックに基づくと、最大103TFLOPsの演算性能が得られ、噂ではさらに高いブーストクロックが示唆されています。

これは、AMDのピーク周波数が平均的な「ゲーム」クロックよりも高いのと同様、ピーククロックのように聞こえるのは間違いない。

100TFLOPs以上の演算性能は、3090 Tiフラッグシップに対して2倍以上の馬力を意味する。

しかし、演算性能は必ずしもゲーム全体の性能を示すものではないことを念頭に置く必要がありますが、それにもかかわらず、ゲーミングPCにとっては大きなアップグレードとなり、現在の最速コンソールであるXboxシリーズXの8.5倍となるのです。

つまり、PCのハードウェア、特にグラフィックカードがより強力になることは間違いありませんが、そのパワーが次世代ゲーム、特にレイトレーシングや将来のグラフィック効果を備えた8Kタイトルを動かすために有効に活用されるのは素晴らしいことです。

AMD、Intel、NVIDIAの次期フラッグシップGPUのスペック（暫定版）

GPU名	AD102	Navi 31	Xe2-HPG
コードネーム	Ada Lovelace	RDNA 3	Battlemage
フラッグシップ	GeForce RTX 4090シリーズ	Radeon RX 7900 シリーズ	Arc B900 シリーズ
製造プロセス	TSMC 4N	TSMC 5nm+ TSMC 6nm	TSCM 5nm?
GPUパッケージ	モノリシック	MCD (マルチ・チップレット・ダイ)	MCM (マルチ・チップレット・モジュール)
GPUダイ	Mono x 1	2 x GCD + 4 x MCD + 1 x IOD	4タイル (tGPU)
GPUメガクラスタ	12 GPCs (グラフィック処理クラスタ)	6シェーダーエンジン	10レンダースライス
GPUスーパークラスター	72 TPC (テクスチャ処理クラスタ)	30 WGPs ( MCD毎) 60 WGPs (合計)	40 Xe-Cores (Tile毎) 160 Xe-コア (合計)
GPU クラスター	144 ストリームマルチプロセッサー (SM)	120 コンピュートユニット(CU) 240 コンピュートユニット (合計)	1280 Xe VE (Tile毎) 5120 Xe VE (合計)
コア数(ダイ毎)	18432 CUDA コア数	7680 SP ( GCD毎) 15360 SP (合計)	20480 ALUs (合計)
ピーククロック	~2.85 GHz	~3.0 GHz	不明
FP32演算性能	~105 TFLOPs	~92 TFLOPs	不明
メモリタイプ	GDDR6X	GDDR6	GDDR6?
メモリ容量	24 GB	32 GB	不明
メモリバス幅	384-bit	256-bit	不明
メモリ速度	~21 Gbps	~18 Gbps	不明
キャッシュサブシステム	96 MB L2 Cache	512 MB (Infinity Cache)	不明
TBP	~600W	~500W	不明
発売時期	2022Q4	2022Q4	2023