NVIDIA GeForce RTX 4080は、Ada Lovelace GPUをベースにした最新のグラフィックスアーキテクチャを提供する、次世代ゲーミングフラッグシップとなります。
このグラフィックスカードは、単体で非常に人気の高いゲーミンググラフィックスカードであるRTX 3080の後継となる予定です。
NVIDIA GeForce RTX 4080グラフィックスカード – エンスージアストゲーマーのために純粋に設計されています。
[更新日-20/05/22】
最高のゲーム性能を提供するハイエンドのGeForce RTX 4090シリーズグラフィックスカードを巡る熱狂は否定できないが、財布を壊さず、なおかつ圧倒的なゲーム性能を提供することを考えると、RTX 4080シリーズグラフィックスカードはほとんどのハイエンドゲーマーが手にする層である。
単純な話、RTX 4090シリーズは金額を気にせず最高のものを求めるユーザー向け、RTX 4080シリーズは最高のゲーム性能を最高の価格で求めるユーザー向けということになります。
前作のGeForce RTX 3080は、RTX 2080を大きく上回る性能を提供すると謳われていたが、その主張は少し物足りなかった。
しかし、RTX 4080はいくつかの理由により、前作をはるかに上回る可能性を秘めているようだ。その理由は、このラウンドアップでそのスペックと性能数値を詳細に説明することで明らかになるだろう。
次世代ゲーミングパワーも同様のことを期待したいところですが、考慮すべき重要な要素は、GPUがよりパワフルになり、より高価になってきているということです。
これは、より良い製品を手に入れるために将来も続くかもしれない傾向ですが、その代わり、エンドユーザーには常にコストが発生します。
そこで、これまでに分かっていることから始めると、まず、次世代GeForce RTX 40シリーズカードに搭載される全く新しいAda LovelaceまたはAD10*クラスのGPUを見てみる必要があります。
NVIDIAのAD103「Ada Lovelace」GPU – 次世代のパワーハウス
GPUの構成から説明すると、NVIDIA GeForce RTX 4080シリーズのグラフィックスカードは、AD103 GPUコアを利用すると言われています。
AD103は、AD102とAD104の間に位置する、AD102の最適化版GPUと考えればよいだろう。
GPUのサイズは約400mm2~450mm2で、グリーンチーム向けに設計されたTSMCの5nm(N5)ノードの最適化バージョンであるTSMC 4Nプロセスノードを利用すると言われています。
NVIDIA Ada Lovelace AD103 GPUは、最大7 GPC(Graphics Processing Clusters)を搭載する見込みです。これはAmpere GA102 GPUと同じGPC数で、GA103 GPUよりGPCが1つ多い。
各GPUは、6つのTPCと2つのSMで構成され、これは従来のチップと同じ構成です。各SM(Streaming Multiprocessor)には4つのサブコアが搭載されますが、これもGA102 GPUと同じです。
変更点は、FP32とINT32のコア構成です。各サブコアには128個のFP32が搭載されるが、FP32+INT32を合わせると最大192個になる。
これは、FP32ユニットがIN32ユニットと同じサブコアを共有しないためだ。128個のFP32コアは、64個のINT32コアとは別になっている。
つまり、各サブコアは、FP32ユニット32個とINT32ユニット16個、合計48個で構成されることになる。各SMは、FP32ユニット128個とINT32ユニット64個、計192個を搭載することになる。
そして、SMは合計84基(GPCあたり12基)あるので、FP32ユニット10,752基、INT32ユニット5,376基、合計18,432基のコアがあることになる。
また、各SMには2つのWrap Schedules(32スレッド/CLK)が含まれ、SMあたり64ラップになります。これはGA102 GPUと比較して、コア数(FP32+INT32)で50%、Wraps/Threadsで33%の増加となっています。
NVIDIA AD103 ‘Ada Lovelace’ Gaming GPU ‘SM’のブロック図(ソース:Kopite7kimi):
※ 画像をクリックすると別Window・タブで開きます。
NVIDIA Ada Lovelace「AD103」GPUのスペックは「速報値」:
GPU名 | AD103 | 対GA102 | 対GA103 | 対TU102 |
GPC | 7 (GPU毎) | 同じ | 1.16x | 1.16x |
TPC | 6 (GPC毎) | 同じ | 1.20x | 同じ |
SM | 2 (TPC毎) | 同じ | 同じ | 同じ |
サブコア | 4 (SM毎) | 同じ | 同じ | 同じ |
FP32 | 128 (SM毎) | 同じ | 同じ | 2x |
FP32+INT32 | 192 (SM毎) | 1.5x | 1.5x | 1.5x |
ワープ数 | 64 (SM毎) | 1.33x | 1.33x | 2x |
スレッド数 | 2048 (SM毎) | 1.33x | 1.33x | 2x |
L1キャッシュ | 192 KB (SM毎) |
1.5x | 1.5x | 2x |
L2キャッシュ | 64 MB (GPU毎) |
10.6x | 16x | 10.6x |
ROP数 | 32 (GPC毎) | 2x | 2x | 2x |
キャッシュに話を移すと、ここもNVIDIAが既存のAmpere GPUに対して大きなブーストをかけた部分である。
Ada Lovelace GPUは、SMあたり192KBのL1キャッシュを搭載し、Ampereから50%増となる。
トップのAD103 GPUでは、合計2.5MBのL1キャッシュを搭載することになる。
L2キャッシュは、リークにあるように64MBに増量される。これは、わずか6MBのL2キャッシュを搭載するAmpere GA102 GPUの10.6倍に相当する。
このキャッシュはGPU全体で共有される予定です。
最後に、ROPsですが、これもAmpereの2倍で、1GPCあたり32個に増えています。
Ampereの最速GPUであるRTX 3090 Tiでは112個しかないROPが、次世代フラッグシップでは最大で224個になるわけです。
また、Ada Lovelace GPUには、最新の第4世代Tensorコアと第3世代RT(Raytracing)コアが搭載されており、DLSSとRaytracingのパフォーマンスを次のレベルに押し上げるのに役立ちます。
Ada Lovelace AD103 GPUは、全体として以下のような特徴を備えています。
- GA102と同量のGPCを搭載
- GA102と同量のコア数
- 50%増のL1キャッシュ(対Ampere比)
- 16倍のL2キャッシュ(対Ampere比)
- 2倍のROPs(対Ampere比)
- 第4世代Tensorコアと第3世代RTコア
NVIDIA AD103 “Ada Lovelace” ゲーミングGPUブロック・ダイアグラムモックアップ(ソース:SemiAnalysis):
なお、2~3GHzとされるクロックは考慮されていないため、Ampereに対するコア単位の性能向上にも大きな役割を果たすことになる。
NVIDIA GeForce RTX 40シリーズ グラフィックカードラインアップ(噂):
グラフィック カード |
GPU | PCBモデル | SMユニット 数 / コア数 |
メモリ容量 /バス幅 |
メモリ クロック /帯域幅 |
TGP | 補助電源 コネクタ |
NVIDIA GeForce RTX 4090 Ti |
AD102-350? | 不明 | 144 / 18432? | 48 GB / 384-bit | 24 Gbps / 1.15 TB/s |
~600W | 16-pin x1 |
NVIDIA GeForce RTX 4090 |
AD102-300? | PG137/139 SKU330 | 126 / 16128? | 24 GB / 384-bit | 21 Gbps / 1.00 TB/s |
~450W | 16-pin x1 |
NVIDIA GeForce RTX 4080 |
AD103-300? | 不明 | >84 / 10752? | 16 GB / 256-bit | 21 Gbps / 672 GB/s |
~350W | 16-pin x1 |
NVIDIA GeForce RTX 4070 |
AD104-400? | PG141-310 SKU341 | >60 / 7680 | 12 GB / 192-bit | 18 Gbps / 432 GB/s |
~300W | 16-pin x1 |
NVIDIA GeForce RTX 4080グラフィックスカードの仕様
GA102GPUで見たように、NVIDIAはGeForce RTX 3080シリーズのラインアップにAD103 GPUのさまざまな構成を用意することができます。
現実的には、RTX 4080とRTX 4080 Tiの2つのバリエーションがあると予想される。前者は初期ラインアップの一部となり、後者はミッドサイクルのリフレッシュとして発売されるでしょう。
最もエントリーレベルのGeForce RTX 30は、フルチップと比較して23%少ないコア数でしたが、今回、「80クラス」のグラフィックスカードは、フラッグシップ機が使用するAD102 GPUに依存するのではなく、独自のチップによって駆動される予定です。
そのため、8704から10752のコアが期待できます。
NVIDIA GeForce RTX 4080の「予想される」仕様
NVIDIA GeForce RTX 4080は、既存のGA102と同じコアで、より高い周波数でチューニングされたカットダウン構成になるか、9000~1000コアの間で、将来的にフルファット構成で「Ti」バリエーションを出す余地がある。
GPUは64MBのL2キャッシュと最大224ROPsを搭載し、まさに正気の沙汰とは思えません。
クロックはまだ確定していませんが、TSMC 4Nプロセスが使用されていることを考慮すると、2.0~3.0GHzのクロックが予想されます。
通常より高いクロックは、Samsungの8nmノードのAmpere GPUが、実際には10nmプロセスノードにいくつかの最適化を施したものだったことを考えると、NVIDIAが2ノードジャンプをしていることに由来しています。
VIDIAは、7nmをスキップして、5nmノードに直行し、バニラバリアントですらなく、その最適化バージョンにしようとしているのです。TSMCの16nmノードのPascalで、NVIDIAは大幅な周波数の飛躍を実現しましたが、今回も同様の飛躍が期待できます。
メモリ仕様については、GeForce RTX 4080は16GB GDDR6Xを搭載し、256ビットバスインターフェースで21Gbpsの速度で動作すると予想されています。
これは、最大672GB/sの帯域幅を提供することになります。
このようにスペックが向上すると、消費電力も高くなり、このフラッグシップモデルは約350WのTBPで動作すると予想されます。
350Wの場合、リファレンスモデルとカスタムモデルの両方で、16ピンのGen 5コネクタ1つで十分なはずです。
また、NVIDIA GeForce RTX 4090 Tiのヒートシンクとクーラー外装の疑惑も確認されており、全体的に大きな構造とともにGPUとメモリダイの両方をカバーする、より頑丈なコールドプレートの使用をほのめかしています。
リークされたクーラーはFounders Editionのデザインで、その大きさから判断すると、AIBモデルは大幅に大きくなり、すべてのパートナーから4スロットデザインが登場することになるかもしれません。
RTX 4080のクーラーも同様に変更されることが予想されます。
機能セットに関しては、NVIDIA GeForce RTX 4080グラフィックスカードは、最新の第4世代テンソルコア、第3世代RTコア、最新のNVENCエンコーダ、NVCDECデコーダ、および最新のAPIのサポートなど、最新のNV機能セットをすべて揺さぶることになります。
また、DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCのサポートなど、最新のRTX機能をすべて搭載しています。
NVIDIA GeForce RTX 4080シリーズ速報スペック:
グラフィック カード名 |
NVIDIA GeForce RTX 4080 Ti |
NVIDIA GeForce RTX 4080 |
NVIDIA GeForce RTX 3090 Ti |
NVIDIA GeForce RTX 3080 |
GPU名 | Ada Lovelace AD103-350? |
Ada Lovelace AD103-300? |
Ampere GA102-225 |
Ampere GA102-200 |
製造プロセス | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
ダイサイズ | ~450mm2 | ~450mm2 | 628.4mm2 | 628.4mm2 |
トランジスタ数 | 不明 | 不明 | 28 Billion | 28 Billion |
CUDAコア数 | 10752? | 9216? | 10240 | 8704 |
TMU数 / ROP数 | 不明 / 224? | 不明 / 214? | 320 / 112 | 272 / 96 |
Tensor / RT コア数 | 不明 / 不明 | 不明 / 不明 | 320 / 80 | 272 / 68 |
ベースクロック | 不明 | 不明 | 1365 MHz | 1440 MHz |
ブーストクロック | ~2600 MHz | ~2500 MHz | 1665 MHz | 1710 MHz |
FP32演算性能 | ~55TFLOPs | ~50 TFLOPs | 34 TFLOPs | 30 TFLOPs |
RT TFLOPs | TBD | TBD | 67 TFLOPs | 58 TFLOPs |
Tensor-TOPs | TBD | TBD | 273 TOPs | 238 TOPs |
メモリ容量 ・種類 |
16 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X |
メモリバス幅 | 256-bit | 256-bit | 384-bit | 320-bit |
メモリ速度 | 24.0 Gbps? | 21.0 Gbps? | 19 Gbps | 19 Gbps |
メモリ帯域幅 | 768 GB/s | 672 2GB/s | 912 Gbps | 760 Gbps |
TGP | 400W | 350W | 350W | 320W |
価格 (希望小売価格 / FE) |
$1199 US? | $699 US? | $1199 | $699 US |
発売時期 | 2022? | 2022/07? | 2021/07/03 | 2020/09/17 |
NVIDIA GeForce RTX 4080グラフィックスカードのパフォーマンス
ゲーミングGPUの性能については、発売が少し先なので、ここでは理論上の数字しか使えませんが、わかっていることから判断すると、RTX 4000シリーズのカードは、100TFLOPsのFP32演算性能に達する最初のゲーミングカードとなるかもしれません。
あくまで比較のためです:
- NVIDIA GeForce RTX 4090 Ti:~103 TFLOPs (FP32) (2.8GHzクロックを仮定)
- NVIDIA GeForce RTX 4090:~90TFLOPs(FP32)(2.8GHzクロックを仮定)
- NVIDIA GeForce RTX 4080:~50TFLOPs(FP32)(2.5GHzクロックを仮定)
- NVIDIA GeForce RTX 3090 Ti:40TFLOPs(FP32)(1.86GHzブーストクロック)
- NVIDIA GeForce RTX 3090:36TFLOPs(FP32)(1.69GHzブーストクロック)
- NVIDIA GeForce RTX 3080:30TFLOPs(FP32)(1.71GHzブーストクロック)
2.5GHzの理論クロックの場合、最大53TFLOPsの演算性能が得られ、噂ではさらに高いブーストクロックが示唆されています。
これは、AMDのピーククロックが平均的な「ゲーム」クロックよりも高いのと同様、ピーククロックのように聞こえるのは間違いないでしょう。
50TFLOPs以上の演算性能は、「90クラスのフラッグシップ」よりも「80クラス」のGPUの方が性能が高いことを意味し、これは良い性能向上になるだろう。
しかし、演算性能は必ずしもゲーム全体の性能を示すものではないことを念頭に置く必要があるが、それにもかかわらず、ゲーミングPCにとっては大きなアップグレードとなり、現在の最速コンソールであるXboxシリーズXの8.5倍にもなるのだ。
これは、GeForce RTX 4080グラフィックスカードが、その前任者に対して70%の計算性能の向上となり、それぞれの部門で大きな飛躍が期待されるRTおよびTensorコア性能を考慮するまでもないことです。
FLOPsは、必ずしもグラフィックスやゲーム性能を反映するものではありませんが、比較のための指標にはなります。
RTX 3090およびRTX 3090 Tiの2倍の性能は、非常に破壊的であり、NVIDIAがカードの電力制限を厳しくしている理由も納得がいくものです。
DLSSを使えば、NVIDIAがRTX 3090シリーズのBFGPUで実現しようとしている、8K解像度での60 FPSのプレイも可能になるかもしれません。
NVIDIA GeForce RTX 4080グラフィックスカードの価格と入手方法
NVIDIA GeForce RTX 3080は699USドルで発売されたが、そのリフレッシュは本当に価格を混乱させた。
RTX 3080 12GBは、希望小売価格なしで発売されたが、NVIDIAは、RTX 3080 Tiの希望小売価格が1199ドルであるのに対し、このモデルの価格帯を899ドルで内部的に計画していた。
価格設定は単純にあちこちにあり、消費者が標準的な80クラスのグラフィックスカードに600ドルまたは700ドル程度のものを支払うのを見ることは決して望んでいません。
Tiは理にかなっていますが、1200USドルという価格設定も無茶ですが、RTX 2080 Ti以来、市場が慣れてしまったものです。
GTX 1080 Tiが699USドルだった時代に戻ればいいのですが、そうもいかないでしょう。そのため、RTX 4080は650~700ドル程度に設定できる一方、Tiのバリエーションは1000~1100ドル近くになってしまう可能性があります。
RTX 4080 TiとRTX 4080の差は、今回もずっと大きくなることでしょう。
NVIDIAは、RTX 3080 Tiから期待したほどの好反応を得られなかったようで、このカードをGPUセグメントから完全に取り除く代わりに、非Tiモデルのスペックをもっと引き下げることにしたのかもしれない。
スペックダウンによって、RTX 3080 & RTX 3080 TiよりもRTX 4080 & RTX 4080 Tiの方が性能差が大きくなるので、今の1桁の性能アップではなく、15~20%の性能アップのために上位バリエーションを入手するだけの価値はあるかもしれません。
NVIDIA GeForce RTX 40シリーズグラフィックスカードは、7月中旬の発売が噂されており、私たちはRTX 4090 Tiの涼しいシュラウドが先にリークするのを見てきましたが、NVIDIAはまだ非Tiバージョンを最初にリリースし、RTX 4090 Tiバージョンがずっと後に市場に登場する可能性があります。
しかし、NVIDIAが次世代のごく初期にハイエンドSKUをリリースするのは、これが初めてではないだろう。
RTX 2080 Tiフラッグシップは、その前身であるGTX 1080 Tiが初期ラインアップの発売から数カ月後に登場したにもかかわらず、他のラインアップと一緒に発売されました。
RTX 3090は、RTX 30シリーズのカードの初期ラインナップと一緒に発売されましたが、3090 Tiは1年以上遅れて登場しました。
今回、NVIDIAは最初から全ファミリーを発売し、後にミッドサイクルリフレッシュを行う可能性もあるが、それはまだわからない。
NVIDIA GeForce GPUのセグメント/ティア価格
グラフィック セグメント |
2014-2016 | 2016-2017 | 2017-2018 | 2018-2019 | 2019-2020 | 2020-2021 | 2021-2022 |
Titan クラス |
Titan X (Maxwell) |
Titan X (Pascal) |
Titan Xp (Pascal) |
Titan V (Volta) |
Titan RTX (Turing) |
GeForce RTX 3090 |
GeForce RTX 3090 Ti GeForce RTX 3090 |
価格 | $999 US | $1199 US | $1199 US | $2999 US | $2499 US | $1499 US | $1999 US $1499 US |
ウルトラ エンスージアスト クラス |
GeForce GTX 980 Ti |
GeForce GTX 980 Ti |
GeForce GTX 1080 Ti |
GeForce RTX 2080 Ti |
GeForce RTX 2080 Ti |
GeForce RTX 3080 Ti |
GeForce RTX 3080 Ti |
価格 | $649 US | $649 US | $699 US | $999 US | $999 US | $1199 US | $1199 US |
エンスージアスト クラス |
GeForce GTX 980 |
GeForce GTX 1080 |
GeForce GTX 1080 |
GeForce RTX 2080 |
GeForce RTX 2080 SUPER |
GeForce RTX 3080 10 GB |
GeForce RTX 3080 12 GB |
価格 | $549 US | $549 US | $549 US | $699 US | $699 US | $699 US | $999 US |
ハイエンド クラス |
GeForce GTX 970 |
GeForce GTX 1070 |
GeForce GTX 1070 |
GeForce RTX 2070 |
GeForce RTX 2070 SUPER |
GeForce RTX 3070 Ti GeForce RTX 3070 |
GeForce RTX 3070 Ti 16 GB |
価格 | $329 US | $379 US | $379 US | $499 US | $499 US | $599 $499 |
未確認 |
メインストリーム クラス |
GeForce GTX 960 |
GeForce GTX 1060 |
GeForce GTX 1060 |
GeForce GTX 1060 |
GeForce RTX 2060 SUPER GeForce RTX 2060 GeForce GTX 1660 Ti GeForce GTX 1660 SUPER GeForce GTX 1660 |
GeForce RTX 3060 Ti GeForce RTX 3060 12 GB |
GeForce RTX 3060 Ti GeForce RTX 3060 12 GB |
価格 | $199 US | $249 US | $249 US | $249 US | $399 US $349 US $279 US $229 US $219 US |
$399 US $329 US |
$399 US $329 US |
エントリー クラス |
GTX 750 Ti GTX 750 |
GTX 950 | GTX 1050 Ti GTX 1050 |
GTX 1050 Ti GTX 1050 |
GTX 1650 SUPER GTX 1650 |
GTX 1650 SUPER GTX 1650 |
RTX 3050 |
価格 | $149 US $119 US |
$149 US | $139 US $109 US |
$139 US $109 US |
$159 US $149 US |
$159 US $149 US |
$249 US |
解説:
ん?RTX4080はAD103を使うのでしょうか?
AmpereのGA103は高性能モバイル向け専用でしたが、どうもLovelaceのAD103はRTX4080に使われるようです。
正直、本当なのかなあと思います。
もし、これがSamsungとTSMCのFabの歩留まりの差だとすれば、SamsungのFabの生産性はいかがなものかと思います。
AD103はRTX4080に搭載するとすれば、10752と言うCUDAコア数からフリシリコンになると思われますが、比較的利益の薄そうなデスクトップ向けにフルシリコンで出す意味があるのかどうか疑問です。
TSMCの4Nは歩留まりが極めて良いのかもしれませんが、GA102のようにRTX3090からRTX3080まで作った方が良いのではないかと思ってしまいます。
RTX3080TiはnVidiaが思ったほど売り上げが伸びず、最近では唯一希望小売価格割れしたモデルですので、RTX4080Tiから扱いを見直すというのは説得力のある話です。
この話が本当だとすると、RTX4080とRTX4090/Tiの間には2倍近くの圧倒的なほどの性能差が存在することになります。
RTX4080Tiが存在するのかどうかまだわかりませんが、AD102を使ってRTX4080とRTX4090の中間くらいの性能だったとしても十分存在価値があるモデルとなるのは確実です。
Ampereの時もGA103と言う新しいチップが存在するというリークが出て、RTX4070に使われるのではないかと言われていましたが、結局モバイル向けでした。
こうしたことを考えるとAD103はモバイル専用なのではないかと言う疑念がぬぐえません。