NVIDIAは、次世代GPUであるGeForce RTX 40「Ada Lovelace」向けにTSMCの次世代5nmウェハ供給の一部を獲得するため、巨額の支出に踏み切ったとされています。
NVIDIAがTSMCの5nm支出に踏み切る、GeForce RTX 40「Ada Lovelace」GPUのためのウェハを獲得するために数十億ドルを支払う。
NVIDIAの次世代グラフィックスカード「GeForce RTX 40」シリーズのラインアップを搭載するAda Lovelace GPUは、TSMCの5nmプロセスノードを利用する見込みです。
AMDとNVIDIAの両社は、このノードを次世代ラインアップに利用する見込みだが、NVIDIAは、ラインアップに十分なウェハ供給を確保するために、台湾の半導体メーカーに5nmウェハの前払いとして数十億ドルを支払ったようで、非常に真剣な様子である。
業界関係者によると、Apple、MediaTek、AMDなど3大顧客に対するTSMCの要求水準は比較的低い。彼らは生産能力を安定させるために、あまり多くの保証金を前払いする必要がない。NVIDIAのような顧客は、5nmの生産受注を獲得したい場合、巨額の前金を事前に支払う必要がある。
via MyDrivers
MyDriversによると、NVIDIAはTSMCに対して、2021年第3四半期に約16億4000万ドルを前払いし、2022年第1四半期に17億9000万ドルを支払う予定であるとのことです。
この長期的な「数十億ドル」の契約は、NVIDIAが昨年支払った金額よりもはるかに高い、69億ドルという途方もないコストになる予定です。
NVIDIAは、この資金をTSMCだけでなく、Samsungからもウェハーを調達するために使用しますが、その金額の大部分はTSMCの5nm技術に費やされるようです。
NVIDIA GeForce RTX 4090グラフィックスカード – Ada Lovelace搭載AD102フラッグシップGPU
これまでの噂から、NVIDIAはAda Lovelace GPUにTSMCのN5(5nm)プロセスノードを利用するのではないかと囁かれていた。
これには、AD102 SKUも含まれ、完全にモノリシック設計となる。具体的なGPUの構成について言えば、フラッグシップのAD102 GPUは、2.5GHz(平均ブースト2.3GHz)という高いクロックスピードを備えていると言われている。
具体的なツイートでは、Ada Lovelace「AD102」のGPUクロックは2.3GHz以上になる可能性があるとされているので、それを基準に、以前リークされた仕様から、パフォーマンスの着地点を探ってみよう。
NVIDIA AD102 “ADA GPU “は、予備的なスペック(変更される可能性がある)に基づいて18432個のCUDAコアを持ち、144個のSMユニット内に収容されるようだ。
これは、Turingから大きく進化したAmpereのほぼ2倍のコア数である。クロック速度が2.3~2.5GHzの場合、最大85~92TFLOPsの演算性能(FP32)を実現することになる。
これは、36TFLOPsのFP32演算能力を持つ既存のRTX 3090のFP32性能の2倍以上となります。
150%の性能ジャンプは大きく見えますが、NVIDIAはすでに今世代、AmpereでFP32の数字を大きくジャンプさせたことを忘れてはいけません。
Ampere GA102 GPU(RTX 3090)は36 TFLOPsを提供し、Turing TU102 GPU(RTX 2080 Ti)は13 TFLOPsを提供しました。
これはFP32 Flopsで150%以上の増加ですが、RTX 3090の実ゲーム性能の増加は、RTX 2080 Tiに対して平均で50~60%程度の速さになっています。
つまり、忘れてはならないのは、最近のGPUのゲーム性能はFlopsとイコールではない、ということだ。
さらに、2.3~2.5GHzが平均的なブーストなのかピークブーストなのかはわからないが、前者であればAD102のコンピュートポテンシャルはさらに高くなる可能性があることを意味している。
それはさておき、リーク情報では、NVIDIA GeForce RTX 40フラッグシップは、RTX 3090と同様に384-bitバスインターフェイスを維持するとも述べられています。
しかし、興味深いのは、リーク者がG6Xに言及していることで、これは、NVIDIAがAda Lovelaceの後まで新しいメモリ規格に移行せず、新しい規格(例えばGDDR7)が登場する前にG6Xの21Gbpsという高いピン速度を次世代カードに利用することを意味しています。
このカードは24GBのメモリを搭載するので、片面16GbのDRAMか、両面8GbのDRAMモジュールが期待できる。
NVIDIA CUDA GPU (噂) 予備版:
GPU | TU102 | GA102 | AD102 |
アーキテクチャー | Turing | Ampere | Ada Lovelace |
製造プロセス | TSMC 12nm NFF |
Samsung 8nm |
5nm |
画像処理 クラスター (GPC) |
6 | 7 | 12 |
テクスチャ処理 クラスター (TPC)数 |
36 | 42 | 72 |
ストリーミング マルチプロセッサー (SM)数 |
72 | 84 | 144 |
CUDAコア数 | 4608 | 10752 | 18432 |
理論演算性能 TFLOPs |
16.1 | 37.6 | ~90 TFLOP? |
メモリ種類 | GDDR6 | GDDR6X | GDDR6X |
メモリバス幅 | 384-bit | 384-bit | 384-bit |
メモリ容量 | 11 GB (2080 Ti) | 24 GB (3090) | 24 GB (4090?) |
フラッグシップ モデル |
RTX 2080 Ti | RTX 3090 | RTX 4090? |
TGP | 250W | 350W | 450-650W? |
発売時期 | 2018年9月 | 2020年9月 | 2022 (不明) |
NVIDIA Ada Lovelace GPUは、AMDのRDNA 3ベースのRadeon RX 7000シリーズグラフィックスカードに真っ向から対抗する次世代GeForce RTX 40グラフィックスカードを搭載する予定です。
NVIDIAによるMCMの採用については、まだいくつかの憶測がある。
主にDatacenter & AIセグメントをターゲットにしたHopper GPUは、近々テープアウトすると言われており、MCMアーキテクチャを採用するという。
NVIDIAは、Ada Lovelace GPUではMCM設計を採用しないので、従来のモノリシック設計のままだろう。
解説:
あっちにフラフラ、こっちにフラフラのnVidiaに対する答え
Fabをしょっちゅう変更するnVidiaがTSMCの5nmを抑えるために巨額の資金を投じたというニュースです。
AMDはTSMC一筋ですが、nVidiaはそうではありません。
私もAmpereがSamsungの8nmになると聞いたときは落胆したものです。
その後、約1.5世代の差があったAMDとnVidiaの製品の性能ですが、AMDがRDNA2でTSMCの7nmを採用したことでほぼ0になりました。
8nmは10nmの改良版であり、7nmとは数字上の差が小さいように見えますが、実際にはかなりの開きがあります。
そのため、とうとう追いつかれてしまいました。
AMDはRDNA3でMCMを採用しますが、5nm+MCMで性能的にはnVidiaを(Lovelaceを)抜くことになると予想されています。
nVidiaはこれに対抗して同じく5nm+MCMのHopperをゲーミング向けに下ろして対抗するのではないかと言われています。
いずれにしろ、現時点ではRDN3のほうがLovelaceより高性能と言うのがリーク界隈の見解です。
nVidiaはAMDよりかなりボリュームが大きいですから、やむを得ないところもあったのかもしれませんが、巨額の投資を必要とするFabをあっちこっちに渡り歩くと、今度は別の面で巨額の金が必要になるというリスクが表に出てきました。