自作PCユーザーがゲーム用PCの解説をします

自作ユーザーが解説するゲーミングPCガイド

NVIDIA GeForce RTX 4080グラフィックスカードのスペック、性能、価格、発売日 – これまでに判明していることのすべて

投稿日:

NVIDIA GeForce RTX 4080は、Ada Lovelace GPUをベースにした最新のグラフィックスアーキテクチャを提供する、次世代ゲーミングフラッグシップとなります。

このグラフィックスカードは、単体で非常に人気の高いゲーミンググラフィックスカードであるRTX 3080の後継となる予定です。

NVIDIA GeForce RTX 4080グラフィックスカード – エンスージアストゲーマーのために純粋に設計されています。

[更新日-20/05/22】

最高のゲーム性能を提供するハイエンドのGeForce RTX 4090シリーズグラフィックスカードを巡る熱狂は否定できないが、財布を壊さず、なおかつ圧倒的なゲーム性能を提供することを考えると、RTX 4080シリーズグラフィックスカードはほとんどのハイエンドゲーマーが手にする層である。

単純な話、RTX 4090シリーズは金額を気にせず最高のものを求めるユーザー向け、RTX 4080シリーズは最高のゲーム性能を最高の価格で求めるユーザー向けということになります。

前作のGeForce RTX 3080は、RTX 2080を大きく上回る性能を提供すると謳われていたが、その主張は少し物足りなかった。

しかし、RTX 4080はいくつかの理由により、前作をはるかに上回る可能性を秘めているようだ。その理由は、このラウンドアップでそのスペックと性能数値を詳細に説明することで明らかになるだろう。

次世代ゲーミングパワーも同様のことを期待したいところですが、考慮すべき重要な要素は、GPUがよりパワフルになり、より高価になってきているということです。

これは、より良い製品を手に入れるために将来も続くかもしれない傾向ですが、その代わり、エンドユーザーには常にコストが発生します。

そこで、これまでに分かっていることから始めると、まず、次世代GeForce RTX 40シリーズカードに搭載される全く新しいAda LovelaceまたはAD10*クラスのGPUを見てみる必要があります。

NVIDIAのAD103「Ada Lovelace」GPU – 次世代のパワーハウス

GPUの構成から説明すると、NVIDIA GeForce RTX 4080シリーズのグラフィックスカードは、AD103 GPUコアを利用すると言われています。

AD103は、AD102とAD104の間に位置する、AD102の最適化版GPUと考えればよいだろう。

GPUのサイズは約400mm2~450mm2で、グリーンチーム向けに設計されたTSMCの5nm(N5)ノードの最適化バージョンであるTSMC 4Nプロセスノードを利用すると言われています。

NVIDIA Ada Lovelace AD103 GPUは、最大7 GPC(Graphics Processing Clusters)を搭載する見込みです。これはAmpere GA102 GPUと同じGPC数で、GA103 GPUよりGPCが1つ多い。

各GPUは、6つのTPCと2つのSMで構成され、これは従来のチップと同じ構成です。各SM(Streaming Multiprocessor)には4つのサブコアが搭載されますが、これもGA102 GPUと同じです。

変更点は、FP32とINT32のコア構成です。各サブコアには128個のFP32が搭載されるが、FP32+INT32を合わせると最大192個になる。

これは、FP32ユニットがIN32ユニットと同じサブコアを共有しないためだ。128個のFP32コアは、64個のINT32コアとは別になっている。

つまり、各サブコアは、FP32ユニット32個とINT32ユニット16個、合計48個で構成されることになる。各SMは、FP32ユニット128個とINT32ユニット64個、計192個を搭載することになる。

そして、SMは合計84基(GPCあたり12基)あるので、FP32ユニット10,752基、INT32ユニット5,376基、合計18,432基のコアがあることになる。

また、各SMには2つのWrap Schedules(32スレッド/CLK)が含まれ、SMあたり64ラップになります。これはGA102 GPUと比較して、コア数(FP32+INT32)で50%、Wraps/Threadsで33%の増加となっています。

NVIDIA AD103 ‘Ada Lovelace’ Gaming GPU ‘SM’のブロック図(ソース:Kopite7kimi):

※ 画像をクリックすると別Window・タブで開きます。

 

NVIDIA Ada Lovelace「AD103」GPUのスペックは「速報値」:

GPU名 AD103 対GA102 対GA103 対TU102
GPC 7 (GPU毎) 同じ 1.16x 1.16x
TPC 6 (GPC毎) 同じ 1.20x 同じ
SM 2 (TPC毎) 同じ 同じ 同じ
サブコア 4 (SM毎) 同じ 同じ 同じ
FP32 128 (SM毎) 同じ 同じ 2x
FP32+INT32 192 (SM毎) 1.5x 1.5x 1.5x
ワープ数 64 (SM毎) 1.33x 1.33x 2x
スレッド数 2048 (SM毎) 1.33x 1.33x 2x
L1キャッシュ 192 KB
(SM毎)
1.5x 1.5x 2x
L2キャッシュ 64 MB
(GPU毎)
10.6x 16x 10.6x
ROP数 32 (GPC毎) 2x 2x 2x

キャッシュに話を移すと、ここもNVIDIAが既存のAmpere GPUに対して大きなブーストをかけた部分である。

Ada Lovelace GPUは、SMあたり192KBのL1キャッシュを搭載し、Ampereから50%増となる。

トップのAD103 GPUでは、合計2.5MBのL1キャッシュを搭載することになる。

L2キャッシュは、リークにあるように64MBに増量される。これは、わずか6MBのL2キャッシュを搭載するAmpere GA102 GPUの10.6倍に相当する。

このキャッシュはGPU全体で共有される予定です。

最後に、ROPsですが、これもAmpereの2倍で、1GPCあたり32個に増えています。

Ampereの最速GPUであるRTX 3090 Tiでは112個しかないROPが、次世代フラッグシップでは最大で224個になるわけです。

また、Ada Lovelace GPUには、最新の第4世代Tensorコアと第3世代RT(Raytracing)コアが搭載されており、DLSSとRaytracingのパフォーマンスを次のレベルに押し上げるのに役立ちます。

Ada Lovelace AD103 GPUは、全体として以下のような特徴を備えています。

  • GA102と同量のGPCを搭載
  • GA102と同量のコア数
  • 50%増のL1キャッシュ(対Ampere比)
  • 16倍のL2キャッシュ(対Ampere比)
  • 2倍のROPs(対Ampere比)
  • 第4世代Tensorコアと第3世代RTコア

NVIDIA AD103 “Ada Lovelace” ゲーミングGPUブロック・ダイアグラムモックアップ(ソース:SemiAnalysis):

なお、2~3GHzとされるクロックは考慮されていないため、Ampereに対するコア単位の性能向上にも大きな役割を果たすことになる。

NVIDIA GeForce RTX 40シリーズ グラフィックカードラインアップ(噂):

グラフィック
カード
GPU PCBモデル SMユニット
数 / コア数
メモリ容量
/バス幅
メモリ
クロック
/帯域幅
TGP 補助電源
コネクタ
NVIDIA GeForce
RTX 4090 Ti
AD102-350? 不明 144 / 18432? 48 GB / 384-bit 24 Gbps
/ 1.15 TB/s
~600W 16-pin x1
NVIDIA GeForce
RTX 4090
AD102-300? PG137/139 SKU330 126 / 16128? 24 GB / 384-bit 21 Gbps
/ 1.00 TB/s
~450W 16-pin x1
NVIDIA GeForce
RTX 4080
AD103-300? 不明 >84 / 10752? 16 GB / 256-bit 21 Gbps
/ 672 GB/s
~350W 16-pin x1
NVIDIA GeForce
RTX 4070
AD104-400? PG141-310 SKU341 >60 / 7680 12 GB / 192-bit 18 Gbps
/ 432 GB/s
~300W 16-pin x1

NVIDIA GeForce RTX 4080グラフィックスカードの仕様

GA102GPUで見たように、NVIDIAはGeForce RTX 3080シリーズのラインアップにAD103 GPUのさまざまな構成を用意することができます。

現実的には、RTX 4080とRTX 4080 Tiの2つのバリエーションがあると予想される。前者は初期ラインアップの一部となり、後者はミッドサイクルのリフレッシュとして発売されるでしょう。

最もエントリーレベルのGeForce RTX 30は、フルチップと比較して23%少ないコア数でしたが、今回、「80クラス」のグラフィックスカードは、フラッグシップ機が使用するAD102 GPUに依存するのではなく、独自のチップによって駆動される予定です。

そのため、8704から10752のコアが期待できます。

NVIDIA GeForce RTX 4080の「予想される」仕様

NVIDIA GeForce RTX 4080は、既存のGA102と同じコアで、より高い周波数でチューニングされたカットダウン構成になるか、9000~1000コアの間で、将来的にフルファット構成で「Ti」バリエーションを出す余地がある。

GPUは64MBのL2キャッシュと最大224ROPsを搭載し、まさに正気の沙汰とは思えません。

クロックはまだ確定していませんが、TSMC 4Nプロセスが使用されていることを考慮すると、2.0~3.0GHzのクロックが予想されます。

通常より高いクロックは、Samsungの8nmノードのAmpere GPUが、実際には10nmプロセスノードにいくつかの最適化を施したものだったことを考えると、NVIDIAが2ノードジャンプをしていることに由来しています。

VIDIAは、7nmをスキップして、5nmノードに直行し、バニラバリアントですらなく、その最適化バージョンにしようとしているのです。TSMCの16nmノードのPascalで、NVIDIAは大幅な周波数の飛躍を実現しましたが、今回も同様の飛躍が期待できます。

メモリ仕様については、GeForce RTX 4080は16GB GDDR6Xを搭載し、256ビットバスインターフェースで21Gbpsの速度で動作すると予想されています。

これは、最大672GB/sの帯域幅を提供することになります。

このようにスペックが向上すると、消費電力も高くなり、このフラッグシップモデルは約350WのTBPで動作すると予想されます。

350Wの場合、リファレンスモデルとカスタムモデルの両方で、16ピンのGen 5コネクタ1つで十分なはずです。

 

また、NVIDIA GeForce RTX 4090 Tiのヒートシンクとクーラー外装の疑惑も確認されており、全体的に大きな構造とともにGPUとメモリダイの両方をカバーする、より頑丈なコールドプレートの使用をほのめかしています。

リークされたクーラーはFounders Editionのデザインで、その大きさから判断すると、AIBモデルは大幅に大きくなり、すべてのパートナーから4スロットデザインが登場することになるかもしれません。

RTX 4080のクーラーも同様に変更されることが予想されます。

機能セットに関しては、NVIDIA GeForce RTX 4080グラフィックスカードは、最新の第4世代テンソルコア、第3世代RTコア、最新のNVENCエンコーダ、NVCDECデコーダ、および最新のAPIのサポートなど、最新のNV機能セットをすべて揺さぶることになります。

また、DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCのサポートなど、最新のRTX機能をすべて搭載しています。

NVIDIA GeForce RTX 4080シリーズ速報スペック:

グラフィック
カード名
NVIDIA GeForce
RTX 4080 Ti
NVIDIA GeForce
RTX 4080
NVIDIA GeForce
RTX 3090 Ti
NVIDIA GeForce
RTX 3080
GPU名 Ada Lovelace
AD103-350?
Ada Lovelace
AD103-300?
Ampere
GA102-225
Ampere
GA102-200
製造プロセス TSMC 4N TSMC 4N Samsung 8nm Samsung 8nm
ダイサイズ ~450mm2 ~450mm2 628.4mm2 628.4mm2
トランジスタ数 不明 不明 28 Billion 28 Billion
CUDAコア数 10752? 9216? 10240 8704
TMU数 / ROP数 不明 / 224? 不明 / 214? 320 / 112 272 / 96
Tensor / RT コア数 不明 / 不明 不明 / 不明 320 / 80 272 / 68
ベースクロック 不明 不明 1365 MHz 1440 MHz
ブーストクロック ~2600 MHz ~2500 MHz 1665 MHz 1710 MHz
FP32演算性能 ~55TFLOPs ~50 TFLOPs 34 TFLOPs 30 TFLOPs
RT TFLOPs TBD TBD 67 TFLOPs 58 TFLOPs
Tensor-TOPs TBD TBD 273 TOPs 238 TOPs
メモリ容量
・種類
16 GB GDDR6X 16 GB GDDR6X 12 GB GDDR6X 10 GB GDDR6X
メモリバス幅 256-bit 256-bit 384-bit 320-bit
メモリ速度 24.0 Gbps? 21.0 Gbps? 19 Gbps 19 Gbps
メモリ帯域幅 768 GB/s 672 2GB/s 912 Gbps 760 Gbps
TGP 400W 350W 350W 320W
価格
(希望小売価格
/ FE)
$1199 US? $699 US? $1199 $699 US
発売時期 2022? 2022/07? 2021/07/03 2020/09/17

NVIDIA GeForce RTX 4080グラフィックスカードのパフォーマンス

ゲーミングGPUの性能については、発売が少し先なので、ここでは理論上の数字しか使えませんが、わかっていることから判断すると、RTX 4000シリーズのカードは、100TFLOPsのFP32演算性能に達する最初のゲーミングカードとなるかもしれません。

あくまで比較のためです:

  • NVIDIA GeForce RTX 4090 Ti:~103 TFLOPs (FP32) (2.8GHzクロックを仮定)
  • NVIDIA GeForce RTX 4090:~90TFLOPs(FP32)(2.8GHzクロックを仮定)
  • NVIDIA GeForce RTX 4080:~50TFLOPs(FP32)(2.5GHzクロックを仮定)
  • NVIDIA GeForce RTX 3090 Ti:40TFLOPs(FP32)(1.86GHzブーストクロック)
  • NVIDIA GeForce RTX 3090:36TFLOPs(FP32)(1.69GHzブーストクロック)
  • NVIDIA GeForce RTX 3080:30TFLOPs(FP32)(1.71GHzブーストクロック)

2.5GHzの理論クロックの場合、最大53TFLOPsの演算性能が得られ、噂ではさらに高いブーストクロックが示唆されています。

これは、AMDのピーククロックが平均的な「ゲーム」クロックよりも高いのと同様、ピーククロックのように聞こえるのは間違いないでしょう。

50TFLOPs以上の演算性能は、「90クラスのフラッグシップ」よりも「80クラス」のGPUの方が性能が高いことを意味し、これは良い性能向上になるだろう。

しかし、演算性能は必ずしもゲーム全体の性能を示すものではないことを念頭に置く必要があるが、それにもかかわらず、ゲーミングPCにとっては大きなアップグレードとなり、現在の最速コンソールであるXboxシリーズXの8.5倍にもなるのだ。

これは、GeForce RTX 4080グラフィックスカードが、その前任者に対して70%の計算性能の向上となり、それぞれの部門で大きな飛躍が期待されるRTおよびTensorコア性能を考慮するまでもないことです。

FLOPsは、必ずしもグラフィックスやゲーム性能を反映するものではありませんが、比較のための指標にはなります。

RTX 3090およびRTX 3090 Tiの2倍の性能は、非常に破壊的であり、NVIDIAがカードの電力制限を厳しくしている理由も納得がいくものです。

DLSSを使えば、NVIDIAがRTX 3090シリーズのBFGPUで実現しようとしている、8K解像度での60 FPSのプレイも可能になるかもしれません。

NVIDIA GeForce RTX 4080グラフィックスカードの価格と入手方法

NVIDIA GeForce RTX 3080は699USドルで発売されたが、そのリフレッシュは本当に価格を混乱させた。

RTX 3080 12GBは、希望小売価格なしで発売されたが、NVIDIAは、RTX 3080 Tiの希望小売価格が1199ドルであるのに対し、このモデルの価格帯を899ドルで内部的に計画していた。

価格設定は単純にあちこちにあり、消費者が標準的な80クラスのグラフィックスカードに600ドルまたは700ドル程度のものを支払うのを見ることは決して望んでいません。

Tiは理にかなっていますが、1200USドルという価格設定も無茶ですが、RTX 2080 Ti以来、市場が慣れてしまったものです。

GTX 1080 Tiが699USドルだった時代に戻ればいいのですが、そうもいかないでしょう。そのため、RTX 4080は650~700ドル程度に設定できる一方、Tiのバリエーションは1000~1100ドル近くになってしまう可能性があります。

RTX 4080 TiとRTX 4080の差は、今回もずっと大きくなることでしょう。

NVIDIAは、RTX 3080 Tiから期待したほどの好反応を得られなかったようで、このカードをGPUセグメントから完全に取り除く代わりに、非Tiモデルのスペックをもっと引き下げることにしたのかもしれない。

スペックダウンによって、RTX 3080 & RTX 3080 TiよりもRTX 4080 & RTX 4080 Tiの方が性能差が大きくなるので、今の1桁の性能アップではなく、15~20%の性能アップのために上位バリエーションを入手するだけの価値はあるかもしれません。

NVIDIA GeForce RTX 40シリーズグラフィックスカードは、7月中旬の発売が噂されており、私たちはRTX 4090 Tiの涼しいシュラウドが先にリークするのを見てきましたが、NVIDIAはまだ非Tiバージョンを最初にリリースし、RTX 4090 Tiバージョンがずっと後に市場に登場する可能性があります。

しかし、NVIDIAが次世代のごく初期にハイエンドSKUをリリースするのは、これが初めてではないだろう。

RTX 2080 Tiフラッグシップは、その前身であるGTX 1080 Tiが初期ラインアップの発売から数カ月後に登場したにもかかわらず、他のラインアップと一緒に発売されました。

RTX 3090は、RTX 30シリーズのカードの初期ラインナップと一緒に発売されましたが、3090 Tiは1年以上遅れて登場しました。

今回、NVIDIAは最初から全ファミリーを発売し、後にミッドサイクルリフレッシュを行う可能性もあるが、それはまだわからない。

NVIDIA GeForce GPUのセグメント/ティア価格

グラフィック
セグメント
2014-2016 2016-2017 2017-2018 2018-2019 2019-2020 2020-2021 2021-2022
Titan
クラス
Titan X
(Maxwell)
Titan X
(Pascal)
Titan Xp
(Pascal)
Titan V
(Volta)
Titan RTX
(Turing)
GeForce
RTX 3090
GeForce
RTX 3090 Ti
GeForce
RTX 3090
価格 $999 US $1199 US $1199 US $2999 US $2499 US $1499 US $1999 US
$1499 US
ウルトラ
エンスージアスト
クラス
GeForce
GTX 980 Ti
GeForce
GTX 980 Ti
GeForce
GTX 1080 Ti
GeForce
RTX 2080 Ti
GeForce
RTX 2080 Ti
GeForce
RTX 3080 Ti
GeForce
RTX 3080 Ti
価格 $649 US $649 US $699 US $999 US $999 US $1199 US $1199 US
エンスージアスト
クラス
GeForce
GTX 980
GeForce
GTX 1080
GeForce
GTX 1080
GeForce
RTX 2080
GeForce RTX
2080 SUPER
GeForce RTX
3080 10 GB
GeForce RTX
3080 12 GB
価格 $549 US $549 US $549 US $699 US $699 US $699 US $999 US
ハイエンド
クラス
GeForce
GTX 970
GeForce
GTX 1070
GeForce
GTX 1070
GeForce
RTX 2070
GeForce RTX
2070 SUPER
GeForce RTX
3070 Ti
GeForce RTX
3070
GeForce RTX
3070 Ti 16 GB
価格 $329 US $379 US $379 US $499 US $499 US $599
$499
未確認
メインストリーム
クラス
GeForce
GTX 960
GeForce
GTX 1060
GeForce
GTX 1060
GeForce
GTX 1060
GeForce RTX
2060 SUPER
GeForce RTX
2060
GeForce GTX
1660 Ti
GeForce GTX
1660 SUPER
GeForce GTX
1660
GeForce RTX
3060 Ti
GeForce RTX
3060 12 GB
GeForce RTX
3060 Ti
GeForce RTX
3060 12 GB
価格 $199 US $249 US $249 US $249 US $399 US
$349 US
$279 US
$229 US
$219 US
$399 US
$329 US
$399 US
$329 US
エントリー
クラス
GTX 750 Ti
GTX 750
GTX 950 GTX 1050 Ti
GTX 1050
GTX 1050 Ti
GTX 1050
GTX 1650
SUPER
GTX 1650
GTX 1650
SUPER
GTX 1650
RTX 3050
価格 $149 US
$119 US
$149 US $139 US
$109 US
$139 US
$109 US
$159 US
$149 US
$159 US
$149 US
$249 US

ソース:wccftech – NVIDIA GeForce RTX 4080 Graphics Card Specs, Performance, Price & Availability – Everything We Know So Far

 

 

 

解説:

ん?RTX4080はAD103を使うのでしょうか?

AmpereのGA103は高性能モバイル向け専用でしたが、どうもLovelaceのAD103はRTX4080に使われるようです。

正直、本当なのかなあと思います。

もし、これがSamsungとTSMCのFabの歩留まりの差だとすれば、SamsungのFabの生産性はいかがなものかと思います。

AD103はRTX4080に搭載するとすれば、10752と言うCUDAコア数からフリシリコンになると思われますが、比較的利益の薄そうなデスクトップ向けにフルシリコンで出す意味があるのかどうか疑問です。

TSMCの4Nは歩留まりが極めて良いのかもしれませんが、GA102のようにRTX3090からRTX3080まで作った方が良いのではないかと思ってしまいます。

RTX3080TiはnVidiaが思ったほど売り上げが伸びず、最近では唯一希望小売価格割れしたモデルですので、RTX4080Tiから扱いを見直すというのは説得力のある話です。

この話が本当だとすると、RTX4080とRTX4090/Tiの間には2倍近くの圧倒的なほどの性能差が存在することになります。

RTX4080Tiが存在するのかどうかまだわかりませんが、AD102を使ってRTX4080とRTX4090の中間くらいの性能だったとしても十分存在価値があるモデルとなるのは確実です。

Ampereの時もGA103と言う新しいチップが存在するというリークが出て、RTX4070に使われるのではないかと言われていましたが、結局モバイル向けでした。

こうしたことを考えるとAD103はモバイル専用なのではないかと言う疑念がぬぐえません。

 

 

 

 

  • B!