NVIDIA GeForce RTX 4080グラフィックスカードに、9728コア、16GB GDDR6Xメモリを搭載、420W TBPとなり、RTX 3090 Tiより35%高速とのリークが登場

昨日のRTX 4070のスペックと同様に、NVIDIA GeForce RTX 4080グラフィックスカードのスペックも更新されました。

NVIDIA GeForce RTX 4080にスペックアップの疑惑：9728コア、16GB GDDR6Xメモリ、420W TBP、3090 Tiより約30％高速化

以前、同じリーカーのKopite7kimi氏がRTX 4080のコア構成を少し良くしたものを掲載していたが、NVIDIAは製品の発売前のサイクルで何度かリビジョン変更を行うため、仕様が大きく変わることを指摘しており、Kopite7kimi氏は単に報告しているに過ぎない。

このカードは、以前に報告されたものよりもはるかに低いTGPで、同じ量のコアとメモリを持っています。

https://twitter.com/kopite7kimi/status/1555447794085019648?ref_src=twsrc%5Etfw

NVIDIA GeForce RTX 4080の「期待される」スペック

NVIDIA GeForce RTX 4080は、従来の構成が80SM、10,240コアを提供していたのに対し、合計84ユニットのうち9,728コア、76SMを有効にしたカットダウンAD103-300 GPU構成を利用すると予想される。

フルGPUは64MBのL2キャッシュと最大224ROPsを搭載しているが、RTX 4080は、そのカットダウン設計により、48MBのL2キャッシュと少ないROP数に過ぎないかもしれない。

クロックはまだ確定していないが、TSMC 4Nプロセスが採用されていることを考えると、2.0～3.0GHzレンジのクロックが予想される。

通常より高いクロックは、Samsungの8nmノードを採用したAmpere GPUが、実際には10nmプロセスノードにいくつかの最適化を施したものだったことを考えると、NVIDIAが2ノードジャンプをしていることに由来する。

NVIDIAは、7nmをスキップして、5nmノード使用し、そのまま使うわけですらなく、その最適化バージョンにしようとしているのです。

TSMC 16nmノードのPascalで、NVIDIAは大きな周波数の飛躍を実現しましたが、今回も同様の飛躍を期待できます。

メモリのスペックとしては、GeForce RTX 4080は16GBのGDDR6Xの容量を揺さぶる見込みで、256bitバスインターフェースで21Gbpsの速度で調整されると言われています。

これは、最大672GB/sの帯域幅を提供することになります。

消費電力は、RTX 4090に近い約420Wとされ、メモリクロックがそれほどアグレッシブではないため、グラフィックス性能を最大化するためにクロックをチューニングすることができると思われる。

性能面では、NVIDIA GeForce RTX 4080は、3DMark Time Spyベンチマークで15,000ポイントを提供すると予想されており、リーク元は以前から控えめな数字としていたので、この特定のベンチマークではRTX 3090 Tiに対して35％程度の性能アップが期待できる。

NVIDIA GeForce RTX 4080グラフィックスカードは、最新の第4世代テンソルコア、第3世代RTコア、最新のNVENCエンコーダ、NVCDECデコーダ、最新のAPIへの対応など、最新のNV機能セットをすべて搭載しています。

DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCのサポートなど、最新のRTX機能もすべて詰め込む予定だそうです。

このグラフィックスカードは、2022年第4四半期頃に発売されるか、あるいは23年第1四半期にもずれ込むかもしれないが、価格は699ドルから799ドル程度になるはずだ。

NVIDIA GeForce RTX 4080シリーズ速報スペック：

グラフィックカード名	NVIDIA GeForce RTX 4080 Ti	NVIDIA GeForce RTX 4080	NVIDIA GeForce RTX 3090 Ti	NVIDIA GeForce RTX 3080
GPU名	Ada Lovelace AD103-350?	Ada Lovelace AD103-300?	Ampere GA102-225	Ampere GA102-200
製造プロセス	TSMC 4N	TSMC 4N	Samsung 8nm	Samsung 8nm
ダイサイズ	~450mm2	~450mm2	628.4mm2	628.4mm2
トランジスタ数	不明	不明	28 Billion	28 Billion
CUDAコア数	10752?	9728?	10240	8704
TMUs / ROPs	不明 / 224?	不明 / 214?	320 / 112	272 / 96
Tensor / RT コア数	不明 / 不明	不明 / 不明	320 / 80	272 / 68
ベースクロック	不明	不明	1365 MHz	1440 MHz
ブーストクロック	~2600 MHz	~2500 MHz	1665 MHz	1710 MHz
FP32演算性能	~55TFLOPs	~50 TFLOPs	34 TFLOPs	30 TFLOPs
RT TFLOPs	不明	不明	67 TFLOPs	58 TFLOPs
Tensor-TOPs	不明	不明	273 TOPs	238 TOPs
メモリ容量・種類	16 GB GDDR6X	16 GB GDDR6X	12 GB GDDR6X	10 GB GDDR6X
メモリバス幅	256-bit	256-bit	384-bit	320-bit
メモリ速度	24.0 Gbps?	21.0 Gbps?	19 Gbps	19 Gbps
メモリ帯域幅	768 GB/s	672 2GB/s	912 Gbps	760 Gbps
TGP	450W	420W	350W	320W
価格 (希望小売価格 / FE)	$1199 US?	$699 US?	$1199	$699 US
発売時期	2022?	2022/7?	2021/06/03	2020/09/17

ソース：wccftech – NVIDIA GeForce RTX 4080 Graphics Card Now Reportedly Features 9728 Cores, 16 GB GDDR6X Memory, 420W TBP, 35% Faster Than RTX 3090 Ti

解説：

RTX4080はAD103のカットダウンモデルで、9728CUDAコアになるらしい・・・。

これはRTX4080がAD103のフルシリコンの95%のCUDAコアを有効にしたカットダウンモデルであることを意味します。

フルシリコンではないので、後からフルシリコンのモデルも出すのかもしれません。

Ampere世代はマイニング特需で需要がぶっ壊れていましたので、TuringのようにSUPERモデルが出ませんでした。(正確に言うと出せなかったのかもしれません。)

その代わり高性能なTiモデルがSUPERリフレッシュの代わりになったモデルもありました。(一部です。)

しかし、マイニング需要が完全に終わった今、Ada Lovelace世代は恐らくTuringと同じようにSUPERリフレッシュが出ることになると思います。

TiモデルとSUPERモデルの違い

Tiモデル

・無印よりも無条件にすべての性能が高い。

・発売時期は無印モデルとほぼ同時期に出ることもある。(かなり後から出ることも当然あります。)

SUPERモデル

・無印モデルよりCUDAコア数が少ないこともある。その代わりメモリが高速化。

・無印モデル発売の1年近く後に発売される

・併売されることもあるが、基本的に無印モデルを置き換える製品になる。

これはTiモデルが純粋に無印モデルの上位であること、SUPERモデルが無印モデルを置き換え、価格の低下を抑えるためのモデルであることが理由でしょう。

つまり、SUPERモデルは販売政策の都合上の意味合いが大きいのに対して、Tiモデルはライバル製品とのラインナップ上の調整の意味合いが強いです。

Ada LovelaceはRTX4080Tiも出るかもしれませんが、SUPERが出る可能性の方が高いと思います。

そうなると、AD102を敢えて使うより、AD103のフルシリコンもしくは有効率は少し上げて、ちょっとだけ性能アップさせた方が自然かなと思います。

一応AD102をRTX4090のCUDAコア有効率88.9%以下にして出す方法もありますが、なかなか難しいのではないかと思います。

もしAD102をカットダウンする場合、恐らくメモリバス幅は320bit、メモリ搭載量は20GBになるかと思います。

この辺はRadeonがどのくらい頑張るかによるかもしれませんね。

Ampere世代のRTX3080Tiはメモリ12GBで純ゲーム向けモデルだったと思いますが、こちらの人気があまり高くなかったこともRTX4080Tiが存在するとしてあまりスペックが高くならないのではないかと思う理由の一つです。

AD102を使って20万円を超えるモデルにするより、AD103を使ってRTX4080とそう変わらない価格のモデルにした方が売れやすいと思います。

GA102を大幅にカットダウンしたRTX3080は$699と言うかなりお得な価格で発売されました。

しかし、マイニング特需が始まり、希望小売価格より大幅に高い価格でしか取引されなくなりました。

この大幅なカットダウンは恐らくSamsungのFabがあまり優秀で無かったことも原因の一つではないかと思います。

TSMCは価格が高いですが、同時に(Samsungよりは)チップの歩留まりも良いでしょう。

そのため、ダイサイズがデカいAD102の生産は出来るだけ抑えて、Ampere世代のRTX3080が担っていたような役割はAD103以下が担うのではないかと考える方が自然です。

これはAmpere世代で言えばGA103はモバイル専用だったわけですが、わざわざAD103をRTX4080に採用した理由と考えると自然なように見えます。