昨日のRTX 4070のスペックと同様に、NVIDIA GeForce RTX 4080グラフィックスカードのスペックも更新されました。
NVIDIA GeForce RTX 4080にスペックアップの疑惑:9728コア、16GB GDDR6Xメモリ、420W TBP、3090 Tiより約30%高速化
以前、同じリーカーのKopite7kimi氏がRTX 4080のコア構成を少し良くしたものを掲載していたが、NVIDIAは製品の発売前のサイクルで何度かリビジョン変更を行うため、仕様が大きく変わることを指摘しており、Kopite7kimi氏は単に報告しているに過ぎない。
このカードは、以前に報告されたものよりもはるかに低いTGPで、同じ量のコアとメモリを持っています。
I'm not a chatterbox, but I have to make some updates. I hope you don't mind.
a possible RTX 4080,
PG136/139-SKU360
AD103-300-A1
9728FP32
256bit 16G 21Gbps GDDR6X
total power ~420W
TSE ~15000
Now I have completed the latest update for 4090, 4080 and 4070.— kopite7kimi (@kopite7kimi) August 5, 2022
NVIDIA GeForce RTX 4080の「期待される」スペック
NVIDIA GeForce RTX 4080は、従来の構成が80SM、10,240コアを提供していたのに対し、合計84ユニットのうち9,728コア、76SMを有効にしたカットダウンAD103-300 GPU構成を利用すると予想される。
フルGPUは64MBのL2キャッシュと最大224ROPsを搭載しているが、RTX 4080は、そのカットダウン設計により、48MBのL2キャッシュと少ないROP数に過ぎないかもしれない。
クロックはまだ確定していないが、TSMC 4Nプロセスが採用されていることを考えると、2.0~3.0GHzレンジのクロックが予想される。
通常より高いクロックは、Samsungの8nmノードを採用したAmpere GPUが、実際には10nmプロセスノードにいくつかの最適化を施したものだったことを考えると、NVIDIAが2ノードジャンプをしていることに由来する。
NVIDIAは、7nmをスキップして、5nmノード使用し、そのまま使うわけですらなく、その最適化バージョンにしようとしているのです。
TSMC 16nmノードのPascalで、NVIDIAは大きな周波数の飛躍を実現しましたが、今回も同様の飛躍を期待できます。
メモリのスペックとしては、GeForce RTX 4080は16GBのGDDR6Xの容量を揺さぶる見込みで、256bitバスインターフェースで21Gbpsの速度で調整されると言われています。
これは、最大672GB/sの帯域幅を提供することになります。
消費電力は、RTX 4090に近い約420Wとされ、メモリクロックがそれほどアグレッシブではないため、グラフィックス性能を最大化するためにクロックをチューニングすることができると思われる。
性能面では、NVIDIA GeForce RTX 4080は、3DMark Time Spyベンチマークで15,000ポイントを提供すると予想されており、リーク元は以前から控えめな数字としていたので、この特定のベンチマークではRTX 3090 Tiに対して35%程度の性能アップが期待できる。
NVIDIA GeForce RTX 4080グラフィックスカードは、最新の第4世代テンソルコア、第3世代RTコア、最新のNVENCエンコーダ、NVCDECデコーダ、最新のAPIへの対応など、最新のNV機能セットをすべて搭載しています。
DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCのサポートなど、最新のRTX機能もすべて詰め込む予定だそうです。
このグラフィックスカードは、2022年第4四半期頃に発売されるか、あるいは23年第1四半期にもずれ込むかもしれないが、価格は699ドルから799ドル程度になるはずだ。
NVIDIA GeForce RTX 4080シリーズ速報スペック:
グラフィック カード名 | NVIDIA GeForce RTX 4080 Ti | NVIDIA GeForce RTX 4080 | NVIDIA GeForce RTX 3090 Ti | NVIDIA GeForce RTX 3080 |
GPU名 | Ada Lovelace AD103-350? | Ada Lovelace AD103-300? | Ampere GA102-225 | Ampere GA102-200 |
製造プロセス | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
ダイサイズ | ~450mm2 | ~450mm2 | 628.4mm2 | 628.4mm2 |
トランジスタ数 | 不明 | 不明 | 28 Billion | 28 Billion |
CUDAコア数 | 10752? | 9728? | 10240 | 8704 |
TMUs / ROPs | 不明 / 224? | 不明 / 214? | 320 / 112 | 272 / 96 |
Tensor / RT コア数 | 不明 / 不明 | 不明 / 不明 | 320 / 80 | 272 / 68 |
ベース クロック | 不明 | 不明 | 1365 MHz | 1440 MHz |
ブースト クロック | ~2600 MHz | ~2500 MHz | 1665 MHz | 1710 MHz |
FP32演算性能 | ~55TFLOPs | ~50 TFLOPs | 34 TFLOPs | 30 TFLOPs |
RT TFLOPs | 不明 | 不明 | 67 TFLOPs | 58 TFLOPs |
Tensor-TOPs | 不明 | 不明 | 273 TOPs | 238 TOPs |
メモリ容量 ・種類 | 16 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X |
メモリバス幅 | 256-bit | 256-bit | 384-bit | 320-bit |
メモリ速度 | 24.0 Gbps? | 21.0 Gbps? | 19 Gbps | 19 Gbps |
メモリ帯域幅 | 768 GB/s | 672 2GB/s | 912 Gbps | 760 Gbps |
TGP | 450W | 420W | 350W | 320W |
価格 (希望小売 価格 / FE) | $1199 US? | $699 US? | $1199 | $699 US |
発売時期 | 2022? | 2022/7? | 2021/06/03 | 2020/09/17 |
解説:
RTX4080はAD103のカットダウンモデルで、9728CUDAコアになるらしい・・・。
これはRTX4080がAD103のフルシリコンの95%のCUDAコアを有効にしたカットダウンモデルであることを意味します。
フルシリコンではないので、後からフルシリコンのモデルも出すのかもしれません。
Ampere世代はマイニング特需で需要がぶっ壊れていましたので、TuringのようにSUPERモデルが出ませんでした。(正確に言うと出せなかったのかもしれません。)
その代わり高性能なTiモデルがSUPERリフレッシュの代わりになったモデルもありました。(一部です。)
しかし、マイニング需要が完全に終わった今、Ada Lovelace世代は恐らくTuringと同じようにSUPERリフレッシュが出ることになると思います。
TiモデルとSUPERモデルの違い
Tiモデル
・無印よりも無条件にすべての性能が高い。
・発売時期は無印モデルとほぼ同時期に出ることもある。(かなり後から出ることも当然あります。)
SUPERモデル
・無印モデルよりCUDAコア数が少ないこともある。その代わりメモリが高速化。
・無印モデル発売の1年近く後に発売される
・併売されることもあるが、基本的に無印モデルを置き換える製品になる。
これはTiモデルが純粋に無印モデルの上位であること、SUPERモデルが無印モデルを置き換え、価格の低下を抑えるためのモデルであることが理由でしょう。
つまり、SUPERモデルは販売政策の都合上の意味合いが大きいのに対して、Tiモデルはライバル製品とのラインナップ上の調整の意味合いが強いです。
Ada LovelaceはRTX4080Tiも出るかもしれませんが、SUPERが出る可能性の方が高いと思います。
そうなると、AD102を敢えて使うより、AD103のフルシリコンもしくは有効率は少し上げて、ちょっとだけ性能アップさせた方が自然かなと思います。
一応AD102をRTX4090のCUDAコア有効率88.9%以下にして出す方法もありますが、なかなか難しいのではないかと思います。
もしAD102をカットダウンする場合、恐らくメモリバス幅は320bit、メモリ搭載量は20GBになるかと思います。
この辺はRadeonがどのくらい頑張るかによるかもしれませんね。
Ampere世代のRTX3080Tiはメモリ12GBで純ゲーム向けモデルだったと思いますが、こちらの人気があまり高くなかったこともRTX4080Tiが存在するとしてあまりスペックが高くならないのではないかと思う理由の一つです。
AD102を使って20万円を超えるモデルにするより、AD103を使ってRTX4080とそう変わらない価格のモデルにした方が売れやすいと思います。
GA102を大幅にカットダウンしたRTX3080は$699と言うかなりお得な価格で発売されました。
しかし、マイニング特需が始まり、希望小売価格より大幅に高い価格でしか取引されなくなりました。
この大幅なカットダウンは恐らくSamsungのFabがあまり優秀で無かったことも原因の一つではないかと思います。
TSMCは価格が高いですが、同時に(Samsungよりは)チップの歩留まりも良いでしょう。
そのため、ダイサイズがデカいAD102の生産は出来るだけ抑えて、Ampere世代のRTX3080が担っていたような役割はAD103以下が担うのではないかと考える方が自然です。
これはAmpere世代で言えばGA103はモバイル専用だったわけですが、わざわざAD103をRTX4080に採用した理由と考えると自然なように見えます。
nVidia RTX4000SUPER
nVidia RTX4000
nVidia RTX3000シリーズGPU
RTX3060 12GB GDDR6
RTX3050 6GB