Greymon55による最新の噂によると、NVIDIAのAda Lovelace AD102 GPUは、2.2GHzという高いクロックを採用する可能性があるとのことです。
NVIDIAの次世代Ada Lovelace「AD102」GPUは、フラッグシップモデルのGeForce RTX 40グラフィックスカードに搭載され、最高2.2GHzのクロックを実現する。
NVIDIAのAda Lovelace GPU、特にAD102 SKUに関しては、すでにかなりの噂が流れている。
AD102は、ゲーマー向け、ワークステーション向けを問わず、グラフィックスカードのフラッグシップラインナップに搭載されるGPUです。
既存のGA102の後継GPUであることから、強力なスペックが期待できます。
これまでの噂によると、NVIDIAはAda Lovelace GPUにTSMCのN5(5nm)プロセスノードを採用するのではないかと囁かれていました。
これには、完全にモノリシックな設計となるAD102 SKUも含まれます。今回のツイートでは、AD102は2.2GHzのクロックを持つとされていますが、具体的なGPUの構成についてはどうなっているのでしょうか。
具体的なツイートでは、Ada Lovelace「AD102」のGPUクロックは2.2GHz以上になる可能性があるとされていますので、これを基準に、以前にリークされた仕様を参考にして、パフォーマンスがどこに着地するかを考えてみましょう。
https://twitter.com/greymon55/status/1439486792332308481?ref_src=twsrc%5Etfw
NVIDIA AD102 “ADA GPU “は、Kopiteが提供している暫定的な仕様(変更される可能性があります)によると、18432個のCUDAコアを搭載しているようです。
これは、Turingから大幅に進化したAmpereの約2倍のコア数です。
クロック速度が2.2GHzの場合、81TFLOPsの演算性能(FP32)が得られます。これは、36TFLOPsのFP32演算能力を持つ既存のRTX 3090の2倍以上の性能です。
125%の性能向上は非常に大きく見えますが、NVIDIAは今世代のAmpereですでにFP32の数値を大きく向上させたことを覚えておく必要があります
Ampere GA102 GPU(RTX 3090)は36 TFLOPsを提供しているのに対し、Turing TU102 GPU(RTX 2080 Ti)は13 TFLOPsでした。
これはFP32 Flopsでは150%以上の増加ですが、RTX 3090の実世界でのゲーム性能の向上は、RTX 2080 Tiに比べて平均50~60%程度の速度でした。
つまり忘れてはならないのは、最近ではFlopsとGPUのゲーム性能はイコールではないということです。
さらに、2.2GHzが平均値なのかピーク値なのかはわかりませんが、前者であれば、AD102にはさらに高い演算性能が期待できるということです。
また、「NVIDIA GeForce RTX 40」は、「RTX 3090」と同様に384ビットのバスインターフェースを採用しているとも述べています。
興味深いのは、リーク者がG6Xに言及していることで、NVIDIAはAda Lovelaceの後まで新しいメモリ規格に移行せず、新しい規格(例:GDDR7)が登場する前に、G6Xの高いピンスピード(20 Gbps以上)を次世代カードに利用することを意味しています。
NVIDIA CUDA GPU(噂)暫定版:
GPU | TU102 | GA102 | AD102 |
アーキテクチャー | Turing | Ampere | Ada Lovelace |
製造プロセス | TSMC 12nm NFF | Samsung 8nm | 5nm |
画像処理 クラスター (GPC) |
6 | 7 | 12 |
テクスチャ処理 クラスター (TPC) |
36 | 42 | 72 |
Streaming Multiprocessors (SM) | 72 | 84 | 144 |
CUDAコア数 | 4608 | 10752 | 18432 |
理論演算性能 TFLOPs |
16.1 | 37.6 | ~80 TFLOPs? |
フラッグシップ SKU |
RTX 2080 Ti | RTX 3090 | RTX 4090? |
TGP | 250W | 350W | 400-500W |
発売時期 | 2018/9 | 2021/09/20 | 2022 (未確認) |
NVIDIA社のAda Lovelace GPUは、AMD社のRDNA 3ベースのRadeon RX 7000シリーズグラフィックスカードに真っ向から対抗する次世代GeForce RTX 40グラフィックスカードに搭載されます。
なお、NVIDIAによるMCMの採用については、まだ様々な憶測が飛び交っています。
主にDatacenter & AIセグメントを対象としたHopper GPUは、近日中にテープアウトすると言われており、MCMアーキテクチャを採用すると言われています。
NVIDIAは、Ada Lovelace GPUではMCMデザインを採用しないので、従来のモノリシックデザインを維持することになる。
一方、AMDはRDNA 3とCDNA 2ファミリーにおいて、MCMとモノリシックの両方のチップを提供することになりました。
CDNA 2のGPUはMCMのみで、RDNA 3はMCMとモノリシックデザインが混在することになる。
各社がどのプロセスノードを採用するかは確認されていませんが、推測によると、AMDのRDNA 3およびCDNA 2ファミリーは、6nmと5nmのノードが混在し、新しいGPUや刷新されたGPUを搭載することになるでしょう。
一方、NVIDIAは、TSMCの5nmプロセスノードをAda Lovelace GPUに採用すると予想されていますが、N5またはN5Pノードで製造されるかどうかは確認されていません。
一方、インテルは、今年後半に量産を開始し、2022年第1四半期に発売する自社のARC AlchemistシリーズのGPUにTSMCの6nmプロセスノードを採用する可能性があるとしています。
解説:
Lovelace AD102は2.2GHzに達するクロック18472CUDAコア、80TFLOPsの理論演算性能となる。
ここまでは過去のリーク通りです。
新しい情報はクロックだけですね。
メモリはGDDR6Xにとどまるという話で、GDDR7にはいかないようです。
FP32が80TFLOPSなのは凄い話ですが、残念ながらAmpereもFP32の割にはゲーム性能が奮いませんでした。
Lovelaceもそうなる可能性は高いと思います。
ただし、FP32の性能が上がるとレンダリング性能がその分、上がることは確か。
クリエイター用途の人にとってはかなり魅力的なGPUになると思います。