Moore's Law is Deadに、NVIDIAのGeForce RTX 40「Ada Lovelace」GPUラインアップに関する肉厚な情報が掲載されています。
この新しい噂には、発売やパフォーマンスの詳細から、フルラインナップ、そして今年後半にグリーンチームが提供しようとしている各階層から期待できることまで、あらゆることが含まれています。
NVIDIA次世代GeForce RTX 40「Ada Lovelace」GPUラインナップ、AMDのRDNA 3 MCM GPUラインナップに挑むべく第3四半期発売の噂が浮上
MLIDが共有した情報のほとんどは、ここ数カ月でわかってきたことであり、最近ではGPUのコードネームだけでなく、次世代ラインナップに搭載される正確なコア構成も明らかにしたNVIDIAのリークで判明していることだ。
※ 画像をクリックすると、別Window・タブで拡大します。
Ada Lovelaceフラッグシップの消費電力は最大で600Wに?
詳細から説明すると、NVIDIAは、GeForce RTX 40「Ada Lovelace」GPUの全ラインアップの電力値を、当初の目標値よりも引き上げていることは明らかだ。
それゆえ、電力数値が850Wまで上がるというばかげた噂を耳にすることがありますが、それは単なる内部テストケースであり、MLIDは、フラッグシップAD102 GPUダイの公称電力消費は、500~600Wの間のどこかに落ち着くと述べ、AIBがすでに高額のヒートシンクとトリプルおよびクアドスロット冷却ソリューションに投資しているので、上限は空冷で可能であるとしています。それ以上になると、より本格的な冷却ソリューションが必要になり、超高級 GPU のバリエーションで液冷またはハイブリッドモデルが採用されることが予想されます。
NVIDIA は、1 つのコネクタで最大 600W の電力入力を提供する新しい PCIe Gen 5 コネクタの開発に既に投資しています。
遅延しているGeForce RTX 3090 Tiは、カードが450WのTGPで揺れると予想される一例で、このようなコネクタインターフェースを利用する最初のデスクトップ用グラフィックスカードとなります。
次世代カードも、同じPCIe規格を利用する見込みです。
いくつかのPSUメーカーは、次世代GPUをサポートするために必要なコネクタを含む新しい第5世代電源のリリースをすでに開始していますが、主要な第5世代コネクタを1つしか備えていないため、NVIDIAが2番目の16ピンポートを使用する場合、ユーザーは2x 8ピン-1x 16ピンアダプタ(これらのPSUのほとんどに付属)を使用しなければならないことになります。
GDDR6X は素晴らしいが、Ada は次世代メモリ規格である GDDR7 の準備もできているかもしれない
MLIDが言及した1つの興味深い点は、彼の情報筋がAda Lovelace GPU内にGDDR7メモリコントローラを搭載していると報告しているようだということです。
現在、NVIDIAは、どのグラフィックスカードでも、完全なGDDR6X速度(24 Gbps)をまだ提供しておらず、次期RTX 3090 Tiでさえ、わずか21 GbpsのG6Xモジュールを利用する見込みなので、メモリ規格にはまだいくつかの余地が残っているのです。
これは、NVIDIAが、当初はGDDR6XメモリでAda Lovelace Rev.1を提供し、後にAda Lovelace Rev.2リフレッシュでGDDR7に移行する(RTX 40 SUPER?)という将来を見据えた動きと言えるかもしれない。
GDDR7メモリは、最大32Gbpsの転送速度と、リアルタイムエラープロテクション技術を提供する見込みだ。
256bit幅のバスインターフェイスで32Gbpsの転送速度を持つGDDR7メモリサブシステムは、1TB/sの総帯域幅を提供する。
384ビットバスインターフェースでは1.5TB/s、512ビットシステムでは最大2TB/sとなります。
これはGDDR規格としては、まさに破格の帯域幅と言える。
GDDRメモリ仕様:
要素 | GDDR5 | GDDR5X | GDDR6 | GDDR6X | GDDR6+ | GDDR7 |
容量 | 512Mb から 8Gb | 8Gb | 8Gb, 16Gb | 8Gb, 16Gb | 8Gb, 16Gb | 8Gb, 16Gb , 32Gb? |
VDDと VDDQ | Either 1.5V or 1.35V | 1.35V | Either 1.35V or 1.25V | Either 1.35V or 1.25V | 不明 | 不明 |
VPP | N/A | 1.8V | 1.8V | 1.8V | 1.8V | 不明 |
転送速度 | 最大 8 Gb/s | 最大 12Gb/s | 最大 16 Gb/s | 19 Gb/s, 21 Gb/s, >21 Gb/s | 24 Gb/s | 32 Gb/s |
パッケージ | BGA-170 14mm x 12mm 0.8mm ボールピッチ | BGA-190 14mm x 12mm 0.65mm ボールピッチ | BGA-180 14mm x 12mm 0.75mm ボールピッチ | BGA-180 14mm x 12mm 0.75mm ボールピッチ | BGA-180 14mm x 12mm 0.75mm ボールピッチ? | 不明 |
I/O 帯域幅 | x32/x16 | x32/x16 | 2 ch x16/x8 | 2 ch x16/x8 | 2 ch x16/x8 | 不明 |
NVIDIA GeForce RTX 40「Ada Lovelace」GPU / グラフィックカード構成図
リークによると、NVIDIAはAda Lovelaceのラインナップの中で、少なくとも6つのGPUを用意するとのことです。
これらは、AD102、AD103、AD104、AD106、AD107、AD10Bを含む予定だ。
最初の5つのSKUは、デスクトップとモバイルセグメント向けに設計され、GeForce RTX 40とRTX Workstationの両方のソリューションに搭載される予定です。
※ 画像をクリックすると、別Window・タブで拡大します。
MLIDはAD102 GPUの噂について自信を持って報告するだけで、他の性能データはほとんど彼の憶測であり、以下に提供します。
- RTX 4090 (AD102) -> RTX 3090 (GA102)に対して+80-110%のラスタライズ性能 / 2倍のレイトレーシング性能
- RTX 4070 (AD103) -> RTX 3090 (GA102)に対して+10-30%のラスタライズ性能 / 2-3クラス上のレイトレーシング性能
- RTX 4060 (AD104) → RTX 3080 (GA102)と同じラスタライズ性能 / 3090に近いレイトレーシング性能
- RTX 4050 Ti (AD106) → RTX 2080 Ti (TU102) と同じラスタライズ性能 / 3070に近いレイトレーシング性能
- RTX 4050 (AD107) → RTX 3060 (GA106)と同じラスタライズ性能 / 3060に近いレイトレーシング性能
リークされたSKUから始めると、次世代GeForce RTX 4090、RTX 4080 Tiグラフィックスカードを搭載すると思われるトップAD102 GPUは、既存のGA102 GPUより71%増の144 SMを使用し、18,432個の巨大CUDAコア数を収容することになります。
フラッグシップチップについて、性能と消費電力の面で聞いたことを考慮すると、NVIDIAがAda Lovelaceファミリーのトップチップに全力を注いでいる可能性が非常に高いと思われます。
AD103 GPUは、先日モバイルで登場したGA103 GPUを置き換えるもので、GA102 GPUと同じSM数84を搭載するのが特徴だ。
AD104、AD106、AD107 GPUは、それぞれ60、36、24のSMユニットを搭載する予定です。GA103から40%SM数が増えたAD103以外のGPUは、前世代から25~20%SM数が増えている。
AD102 GPUほどではないが、これがメインストリームセグメントであることを考えると、RTX 4060 TiでRTX 3080またはそれに近い性能&標準のRTX 4060でRTX 3070以上の性能が得られる可能性が高いと思われる。
RTX 4050は、アーキテクチャのアップグレードとは別に、IPCとクロックの向上が加わっていることから、RTX 3060と近いか同程度になるはずです。
Ada Lovelace GPUは、SM数に加えて、L2キャッシュのサイズも拡大される。AD102 GPUでは、最大96MBのL2キャッシュを搭載し、GA102の6MBのL2キャッシュの16倍という驚異的な増加を実現しています。
AD103 GPUは64MB、AD104 GPUは48MB、AD106/AD107 GPUは32MBのL2キャッシュを搭載する予定です。
メモリバスは、フラッグシップのAD102が384-bit、AD103が256-bit、AD104が192-bit、AD106/AD107が128-bitのバスインターフェイスを採用する予定だ。
NVIDIA Ada Lovelace「GeForce RTX 40」GPU構成図
GPU名 | GPC数 / TPC数 | TPC毎の SM数 / 合計 | CUDA コア数 | L2キャッシュ | メモリ バス幅 |
AD102 | 12 / 6 | 2 / 144 | 18432 | 96 MB | 384-bit |
AD103 | 7 / 6 | 2 / 84 | 10752 | 64 MB | 256-bit |
AD104 | 5 / 6 | 2 / 60 | 7680 | 48 MB | 192-bit |
AD106 | 3 / 6 | 2 / 36 | 4608 | 32 MB | 128-bit |
AD107 | 3 / 4 | 2 / 24 | 3072 | 32 MB | 128-bit |
※ 画像をクリックすると、別Window・タブで拡大します。
NVIDIA Ada LovelaceとAmpere GPUの比較
Ada Lovelace GPU | SM数 | CUDAコア数 | フラッグ シップSKU | メモリ バス幅 | Ampere GPU | SM数 | CUDAコア数 | フラッグ シップSKU | メモリ バス幅 | SM増加率 ( Ampere 超え率) |
AD102 | 144 | 18432 | RTX 4090? | 384-bit | GA102 | 84 | 10752 | RTX 3090 Ti | 384-bit | 71% |
AD103 | 84 | 10752 | RTX 4070? | 256-bit | GA103S | 60 | 7680 | RTX 3080 Ti | 256-bit | 40% |
AD104 | 60 | 7680 | RTX 4060? | 192-bit | GA104 | 48 | 6144 | RTX 3070 Ti | 256-bit | 25% |
AD106 | 36 | 4608 | RTX 4050 Ti? | 128-bit | GA106 | 30 | 3840 | RTX 3060 | 192-bit | 20% |
AD107 | 24 | 3072 | RTX 4050? | 128-bit | GA107 | 20 | 2560 | RTX 3050 | 128-bit | 20% |
NVIDIA Ada Lovelace GPUファミリーは、MaxwellからPascalに似た世代交代をもたらすと期待されています。
2022年後半に発売される予定だが、NVIDIAが数十億ドルを投じて、あのとても素晴らしいTSMC 5nmウェハーを獲得したにもかかわらず、供給と価格は現在のカードと同様であると予想される。
解説:
Lovelaceのリーク(噂)がまた上がってきました。
今までのラインナップと違うところはモバイル専用だったGA103の後継であるAD103をデスクトップのラインナップに加えているところです。
GDDR7を使うという予想もあります。
当初のラインナップはGDDR6Xを使い、Turingから始まったSUPERリフレッシュでGDDR7を使うという予想も立っています。
当面は8GBあれば十分と言われたメモリはライバルへの対抗のためか倍増しています。
昨今はマイニングを考慮しなくてもGPUの価格が高額化していますので、ユーザーに価格を納得させるための一つの要素としてやはりメモリを増量する必要があるのかもしれません。
また、ゲーム機と違ってクリエイター用途にも使われますから、そういった点でも広帯域メモリであるGDDRを増量する必要があったのかもしれません。
比較としてRDNA3も掲載されていますが、今回は最上位モデル同士の比較ではRDNA3のほうが高性能と予想されており、Hopperが下りてくるとかRTX4090Tiのスペシャルエディションが準備されているなどと言う噂が上がっています。
ただし、例年の噂と違って、今回はnVidiaがハッキングを受けて流出した情報が元になっているので、いつもよりは正確かもしれない。
価格に関してはまだ確定していないようですが、RDNA3の最上位モデルが$1499-$2499と予想されています。
また、各モデル毎に+10-30%旧モデルより高くなると予想されています。
$1499-$2499は日本円に直すと
- 1ドル115円の通常レートで172,385円から287,385円、
- Turing時のレート(165円)で247,355円から412,335円、
- Ampere時のレート(200円以上)で279,800円から499,800円
となります。
とんでもなく高額になるということは覚悟しておいた方がよさそうです。
RDNA3 VS Lovelaceはトップモデルの性能がRDNA3の方がかなり優れていると言われていますので、nVidiaがAMDの動向をうかがうという珍しい展開になりそうですね。
これだけの性能を引き出すには近年発売され、競争によってシングルスレッド性能が磨かれた最新のCPUが必須となるでしょう。
最低でもZen3、Rocketlake、出来ればAlderLake、Zen4、RaptorLakeが無ければ、その真価を発揮できないかもしれません。
旧来のAmpereを在庫している業者は早めに処分しておかないと即死級のダメージになると思います。
希望小売価格よりもかなり高い価格で売られているGPUですが、イーサリアムのPoSも6月に来ますし、それ以降は価格がますます落ちると思います。
前にも一度書きましたが、高騰したGPUの価格はどこかで調整されないと、転売屋も含めて最後に在庫を持っている会社が爆死確定のババ抜きのようなものです。
今まで相場以上の価格で儲けてきたところには是非調整に一役買っていただきたいところです。(苦笑。
既に次世代GPUのリークが始まっているところにIntleの Alchemistが来るのはかなりの周回遅れ感があります。
早く発売して、次世代に行かないと益々引き離されてしまうと思うのですが・・・。
nVidia RTX4000SUPER
nVidia RTX4000
nVidia RTX3000シリーズGPU
RTX3060 12GB GDDR6
RTX3050 6GB