GPU情報

NVIDIA GeForce RTX 4080グラフィックスカードに、9728コア、16GB GDDR6Xメモリを搭載、420W TBPとなり、RTX 3090 Tiより35%高速とのリークが登場

投稿日:

昨日のRTX 4070のスペックと同様に、NVIDIA GeForce RTX 4080グラフィックスカードのスペックも更新されました。

NVIDIA GeForce RTX 4080にスペックアップの疑惑:9728コア、16GB GDDR6Xメモリ、420W TBP、3090 Tiより約30%高速化

以前、同じリーカーのKopite7kimi氏がRTX 4080のコア構成を少し良くしたものを掲載していたが、NVIDIAは製品の発売前のサイクルで何度かリビジョン変更を行うため、仕様が大きく変わることを指摘しており、Kopite7kimi氏は単に報告しているに過ぎない。

このカードは、以前に報告されたものよりもはるかに低いTGPで、同じ量のコアとメモリを持っています。

NVIDIA GeForce RTX 4080の「期待される」スペック

NVIDIA GeForce RTX 4080は、従来の構成が80SM、10,240コアを提供していたのに対し、合計84ユニットのうち9,728コア、76SMを有効にしたカットダウンAD103-300 GPU構成を利用すると予想される。

フルGPUは64MBのL2キャッシュと最大224ROPsを搭載しているが、RTX 4080は、そのカットダウン設計により、48MBのL2キャッシュと少ないROP数に過ぎないかもしれない。

クロックはまだ確定していないが、TSMC 4Nプロセスが採用されていることを考えると、2.0~3.0GHzレンジのクロックが予想される。

通常より高いクロックは、Samsungの8nmノードを採用したAmpere GPUが、実際には10nmプロセスノードにいくつかの最適化を施したものだったことを考えると、NVIDIAが2ノードジャンプをしていることに由来する。

NVIDIAは、7nmをスキップして、5nmノード使用し、そのまま使うわけですらなく、その最適化バージョンにしようとしているのです。

TSMC 16nmノードのPascalで、NVIDIAは大きな周波数の飛躍を実現しましたが、今回も同様の飛躍を期待できます。

 

メモリのスペックとしては、GeForce RTX 4080は16GBのGDDR6Xの容量を揺さぶる見込みで、256bitバスインターフェースで21Gbpsの速度で調整されると言われています。

これは、最大672GB/sの帯域幅を提供することになります。

消費電力は、RTX 4090に近い約420Wとされ、メモリクロックがそれほどアグレッシブではないため、グラフィックス性能を最大化するためにクロックをチューニングすることができると思われる。

性能面では、NVIDIA GeForce RTX 4080は、3DMark Time Spyベンチマークで15,000ポイントを提供すると予想されており、リーク元は以前から控えめな数字としていたので、この特定のベンチマークではRTX 3090 Tiに対して35%程度の性能アップが期待できる。

 

 

NVIDIA GeForce RTX 4080グラフィックスカードは、最新の第4世代テンソルコア、第3世代RTコア、最新のNVENCエンコーダ、NVCDECデコーダ、最新のAPIへの対応など、最新のNV機能セットをすべて搭載しています。

DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCのサポートなど、最新のRTX機能もすべて詰め込む予定だそうです。

このグラフィックスカードは、2022年第4四半期頃に発売されるか、あるいは23年第1四半期にもずれ込むかもしれないが、価格は699ドルから799ドル程度になるはずだ。

NVIDIA GeForce RTX 4080シリーズ速報スペック:

グラフィック
カード名
NVIDIA GeForce
RTX 4080 Ti
NVIDIA GeForce
RTX 4080
NVIDIA GeForce
RTX 3090 Ti
NVIDIA GeForce
RTX 3080
GPU名Ada Lovelace AD103-350?Ada Lovelace AD103-300?Ampere GA102-225Ampere GA102-200
製造プロセスTSMC 4NTSMC 4NSamsung 8nmSamsung 8nm
ダイサイズ~450mm2~450mm2628.4mm2628.4mm2
トランジスタ数不明不明28 Billion28 Billion
CUDAコア数10752?9728?102408704
TMUs / ROPs不明 / 224?不明 / 214?320 / 112272 / 96
Tensor
/ RT コア数
不明 / 不明不明 / 不明320 / 80272 / 68
ベース
クロック
不明不明1365 MHz1440 MHz
ブースト
クロック
~2600 MHz~2500 MHz1665 MHz1710 MHz
FP32演算性能~55TFLOPs~50 TFLOPs34 TFLOPs30 TFLOPs
RT TFLOPs不明不明67 TFLOPs58 TFLOPs
Tensor-TOPs不明不明273 TOPs238 TOPs
メモリ容量
・種類
16 GB GDDR6X16 GB GDDR6X12 GB GDDR6X10 GB GDDR6X
メモリバス幅256-bit256-bit384-bit320-bit
メモリ速度24.0 Gbps?21.0 Gbps?19 Gbps19 Gbps
メモリ帯域幅768 GB/s672 2GB/s912 Gbps760 Gbps
TGP450W420W350W320W
価格 (希望小売
価格 / FE)
$1199 US?$699 US?$1199$699 US
発売時期2022?2022/7?2021/06/032020/09/17

ソース:wccftech - NVIDIA GeForce RTX 4080 Graphics Card Now Reportedly Features 9728 Cores, 16 GB GDDR6X Memory, 420W TBP, 35% Faster Than RTX 3090 Ti

 

 

 

 

解説:

RTX4080はAD103のカットダウンモデルで、9728CUDAコアになるらしい・・・。

これはRTX4080がAD103のフルシリコンの95%のCUDAコアを有効にしたカットダウンモデルであることを意味します。

フルシリコンではないので、後からフルシリコンのモデルも出すのかもしれません。

Ampere世代はマイニング特需で需要がぶっ壊れていましたので、TuringのようにSUPERモデルが出ませんでした。(正確に言うと出せなかったのかもしれません。)

その代わり高性能なTiモデルがSUPERリフレッシュの代わりになったモデルもありました。(一部です。)

しかし、マイニング需要が完全に終わった今、Ada Lovelace世代は恐らくTuringと同じようにSUPERリフレッシュが出ることになると思います。

 

TiモデルとSUPERモデルの違い

Tiモデル

・無印よりも無条件にすべての性能が高い。

・発売時期は無印モデルとほぼ同時期に出ることもある。(かなり後から出ることも当然あります。)

 

SUPERモデル

・無印モデルよりCUDAコア数が少ないこともある。その代わりメモリが高速化。

・無印モデル発売の1年近く後に発売される

・併売されることもあるが、基本的に無印モデルを置き換える製品になる。

 

これはTiモデルが純粋に無印モデルの上位であること、SUPERモデルが無印モデルを置き換え、価格の低下を抑えるためのモデルであることが理由でしょう。

つまり、SUPERモデルは販売政策の都合上の意味合いが大きいのに対して、Tiモデルはライバル製品とのラインナップ上の調整の意味合いが強いです。

 

Ada LovelaceはRTX4080Tiも出るかもしれませんが、SUPERが出る可能性の方が高いと思います。

そうなると、AD102を敢えて使うより、AD103のフルシリコンもしくは有効率は少し上げて、ちょっとだけ性能アップさせた方が自然かなと思います。

一応AD102をRTX4090のCUDAコア有効率88.9%以下にして出す方法もありますが、なかなか難しいのではないかと思います。

もしAD102をカットダウンする場合、恐らくメモリバス幅は320bit、メモリ搭載量は20GBになるかと思います。

この辺はRadeonがどのくらい頑張るかによるかもしれませんね。

Ampere世代のRTX3080Tiはメモリ12GBで純ゲーム向けモデルだったと思いますが、こちらの人気があまり高くなかったこともRTX4080Tiが存在するとしてあまりスペックが高くならないのではないかと思う理由の一つです。

AD102を使って20万円を超えるモデルにするより、AD103を使ってRTX4080とそう変わらない価格のモデルにした方が売れやすいと思います。

GA102を大幅にカットダウンしたRTX3080は$699と言うかなりお得な価格で発売されました。

しかし、マイニング特需が始まり、希望小売価格より大幅に高い価格でしか取引されなくなりました。

この大幅なカットダウンは恐らくSamsungのFabがあまり優秀で無かったことも原因の一つではないかと思います。

TSMCは価格が高いですが、同時に(Samsungよりは)チップの歩留まりも良いでしょう。

そのため、ダイサイズがデカいAD102の生産は出来るだけ抑えて、Ampere世代のRTX3080が担っていたような役割はAD103以下が担うのではないかと考える方が自然です。

これはAmpere世代で言えばGA103はモバイル専用だったわけですが、わざわざAD103をRTX4080に採用した理由と考えると自然なように見えます。

 

 

nVidia RTX4000SUPER

 

nVidia RTX4000

 

nVidia RTX3000シリーズGPU

RTX3060 12GB GDDR6

 

RTX3050 6GB

-GPU情報
-,

Copyright© 自作ユーザーが解説するゲーミングPCガイド , 2024 All Rights Reserved.