NVIDIA GeForce RTX 4070グラフィックスカードのスペック、性能、価格、発売日 - これまでに判明していることすべて

NVIDIA GeForce RTX 4070は、Ada Lovelace GPUをベースにした最新のグラフィックスアーキテクチャを提供する、次世代ハイエンドゲーミンググラフィックスカードになります。

このグラフィックスカードは、米国500ドルから600ドルの価格帯で非常に人気のあるゲーミンググラフィックスカードであるRTX 3070の後継となる予定です。

NVIDIA GeForce RTX 4070 Graphics Card - Purely Designed For Enthusiast Gamers（エンスージアスト・ゲーマー向け純国産グラフィックスカード
[更新日-22/05/28】

最高のゲーム性能を提供するハイエンドのGeForce RTX 4090 & GeForce RTX 4080シリーズグラフィックスカードの周りの熱気は否定できませんが、RTX 4070シリーズグラフィックスカードは、まだ手元に多くの性能を提供するハイエンド価格帯である500ドル米国セグメントを中心に設計される予定です。

単純な話、RTX 4090シリーズは金額を気にせず最高のものを求めるユーザー向け、RTX 4080シリーズは最高のゲーム性能をできるだけ安く求めるユーザー向けとなります。

RTX 4070は、ハイエンドゲーミングの最も使いやすい製品となり、非常に滑らかな2Kゲーム体験を提供します。

前作のGeForce RTX 3070は、RTX 2070から大きく進化し、RTX 2080 Tiよりも速いパフォーマンスを提供すると言われていましたが、RTX 3070 Tiだけが前回のTuring GPUフラッグシップのパフォーマンスを上回り、ほぼTuringフラッグシップと同等の性能でした。

RTX 4070も同じような位置づけで、RTX 3080 Tiと同等かそれに近いグラフィックス性能を提供しつつ、「Ti」バリエーションでグラフィックス性能をさらに先取りする可能性がありそうです。

次世代ゲーミングソリューションでも同様のことを期待したいところですが、考慮すべき重要な要素は、GPUがよりパワフルになり、より高価になってきているということです。

これは、より良い製品を手に入れるために将来も続くかもしれない傾向ですが、その代わり、エンドユーザーには常にコストが発生します。

そこで、これまでに分かっていることから始めると、まず、次世代GeForce RTX 40シリーズカードに搭載される全く新しいAda LovelaceまたはAD10*クラスのGPUを見てみる必要があります。

NVIDIAのAD104「Ada Lovelace」GPU - 次世代のパワーハウス

GPUの構成から説明すると、NVIDIA GeForce RTX 4070シリーズのグラフィックスカードは、GPUコア「AD104」を利用するとされていています。

このGPUは約300mm2の大きさで、グリーンチーム向けに設計されたTSMCの5nm(N5)ノードを最適化したTSMC 4Nプロセスノードを利用するとされています。

NVIDIA Ada Lovelace AD104 GPUは、最大5 GPC(Graphics Processing Clusters)を搭載する見込みです。

これは、GA104 GPUよりもGPCが1つ少ない。各GPUは、6個のTPCと2個のSMで構成され、これは従来のチップと同じ構成である。各SM(Streaming Multiprocessor)には、4つのサブコアが搭載されますが、これもGA102 GPUと同じです。

変更点は、FP32とINT32のコア構成です。各サブコアには128個のFP32が搭載されるが、FP32+INT32を合わせると最大192個になります。

これは、FP32ユニットがIN32ユニットと同じサブコアを共有しないためだ。128個のFP32コアは、64個のINT32コアとは別になっています。

つまり、各サブコアは、FP32ユニット32個とINT32ユニット16個、合計48個で構成されることになります。

各SMは、FP32ユニット128個とINT32ユニット64個、計192個を搭載することになります。

そして、SMは合計60基(GPCあたり12基)なので、FP32ユニット7,680基、INT32ユニット3,840基、合計11,520基のコアを持つことになります。

また、各SMには2つのWrap Schedules（32スレッド/CLK）が含まれ、SMあたり64ラップになります。

これはGA102 GPUと比較して、コア数(FP32+INT32)で50%、Wraps/Threadsで33%の増加となっています。

NVIDIA AD103 'Ada Lovelace' Gaming GPU 'SM'のブロック図（ソース：Kopite7kimi）：

※　画像をクリックすると、別Window・タブで拡大します。

キャッシュに話を移すと、ここもNVIDIAが既存のAmpere GPUに対して大きなブーストをかけた部分です。

Ada Lovelace GPUは、SMあたり192KBのL1キャッシュを搭載し、Ampereから50%増となります。

これは、トップのAD104 GPUでは、合計2MBのL1キャッシュを搭載することになります。

L2キャッシュは、リークにあるように48MBに増量されます。

これは、わずか4MBのL2キャッシュを搭載するAmpere GA104 GPUの12倍に相当する。このキャッシュはGPU全体で共有される予定です。

最後に、ROPですが、これも1GPCあたり32個に増え、Ampereの2倍になっています。

AmpereのGA104 GPUが96個であるのに対し、最大160個のROPを搭載することになります。

また、Ada Lovelace GPUには、最新の第4世代Tensorコアと第3世代RT（Raytracing）コアが搭載されており、DLSSとRaytracingのパフォーマンスを次のレベルに引き上げるのに役立ちます。

Ada Lovelace AD103 GPUは、全体として以下のような特徴を備えています。

5GPC vs GA104の6GPC
コア数 +25% vs GA104 GPU
50%増のL1キャッシュ(Ampere GA104比)
2倍のL2キャッシュ（Ampere GA104比）
+66% ROPs (Ampere GA104比)
第4世代Tensorコアと第3世代RTコア

NVIDIA AD104 'Ada Lovelace' ゲーミングGPUブロックダイアグラム・モックアップ（画像提供：SemiAnalysis）：

※　画像をクリックすると、別Window・タブで拡大します。

なお、2～3GHzとされるクロックは考慮されていないため、アンペアに対するコア単位の性能向上にも大きな役割を果たすことになります。

NVIDIA GeForce RTX 4070シリーズ速報スペック：

グラフィックカード名	NVIDIA GeForce RTX 4070 Ti	NVIDIA GeForce RTX 4070	NVIDIA GeForce RTX 3070 Ti	NVIDIA GeForce RTX 3070
GPU名	AD104-400?	AD104-300?	Ampere GA104-400	Ampere GA104-300
製造プロセス	TSMC 4N	TSMC 4N	Samsung 8nm	Samsung 8nm
ダイサイズ	~300mm2	~300mm2	395.2mm2	395.2mm2
トランジスタ数	不明	不明	174億	174億
CUDAコア数	~7680	~7040	6144	5888
TMU数 / ROP数	不明 / 160	不明 / 144	192/ 96	184 / 96
Tensor / RT コア数	不明 / 不明	不明 / 不明	192/ 48	184 / 46
ベースクロック	不明	不明	1575 MHz	1500 MHz
ブーストクロック	不明	不明	1770 MHz	1730 MHz
FP32演算能力	~38 TFLOPs	~36 TFLOPs	22 TFLOPs	20 TFLOPs
RT TFLOPs	不明	不明	42 TFLOPs	40 TFLOPs
Tensor-TOPs	不明	不明	174 TOPs	163 TOPs
メモリ容量・種類	12 GB GDDR6X?	12 GB GDDR6	8 GB GDDR6X	8 GB GDDR6
メモリバス幅	192-bit	192-bit	256-bit	256-bit
メモリ速度	21 Gbps	18 Gbps	19 Gbps	14 Gbps
メモリ帯域幅	504 GB/s	432 GB/s	608 Gbps	448 Gbps
TGP	~330W	~300W	290W	220W
価格 (希望小売価格 / FE)	$599 US?	$499 US?	$599 US	$499 US
発売時期	2022	2022	2021/06/10	2020/10/29

NVIDIA GeForce RTX 4070グラフィックスカードの仕様

GA104GPUで見たように、NVIDIAはGeForce RTX 4070シリーズのラインアップにAD104 GPUのさまざまな構成を用意することができます。

現実的には、RTX 4070とRTX 4070 Tiの2つのバリエーションがあると予想されます。

前者は初期ラインアップの一部となり、後者はミッドサイクルのリフレッシュとして発売されるでしょう。

最もエントリーレベルのGeForce RTX 3000は、フルチップと比較して23％少ないコア数でしたが、今回、「80クラス」のグラフィックスカードは、フラッグシップ機が使用するAD102 GPUに依存するのではなく、独自のチップが搭載される予定です。

そのため、6144から7680のフルコア構成になると予想されます。

NVIDIA GeForce RTX 4070の「予想される」仕様

NVIDIA GeForce RTX 4070は、RTX 3070 TI（6144コア）よりも若干コア数が多く、将来的にフルファット構成の「Ti」バリエーションが登場する余地があるカットダウン構成となる予定です。

このGPUは、48MBのL2キャッシュと最大160のROPsを搭載しており、まさに狂気の沙汰です。

クロックはまだ確定していませんが、TSMC 4Nプロセスが使用されていることを考慮すると、2.0～3.0GHzのクロックが予想されます。

通常より高いクロックは、Samsungの8nmノードのAmpere GPUが、実際には10nmプロセスノードにいくつかの最適化を施したものだったことを考えると、NVIDIAが2ノードジャンプをしていることが原因でしょう。

NVIDIAは、7nmをスキップして、5nmノードに直行し、無印モデルでもなく、その最適化バージョンにしようとしているのです。

TSMCの16nmノードのPascalで、NVIDIAは大幅な周波数の飛躍を実現しましたが、今回も同様の飛躍が期待できます。

メモリ仕様については、GeForce RTX 4070は12GB GDDR6を搭載し、192ビットバスインターフェースでより高速な18Gbpsの速度で動作すると予想されます。

これは、最大432GB/sの帯域幅を提供することになります。

このように仕様が強化されると、消費電力も高くなり、このフラッグシップモデルは約300WのTBPで動作すると予想されます。

300Wの場合、リファレンスモデルとカスタムモデルの両方で、16ピンのGen 5コネクタ1つで十分なはずです。

NVIDIA GeForce RTX 4070グラフィックスカードは、最新の第4世代Tensorコア、第3世代RTコア、最新のNVENCエンコーダ、NVCDECデコーダ、最新のAPIへの対応など、最新のNV機能セットをすべて搭載しています。

また、DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCのサポートなど、最新のRTX機能をすべて搭載しています。

NVIDIA GeForce RTX 4080シリーズ速報スペック：

グラフィックスカード名	NVIDIA GeForce RTX 4080 Ti	NVIDIA GeForce RTX 4080	NVIDIA GeForce RTX 3090 Ti	NVIDIA GeForce RTX 3080
GPU名	Ada Lovelace AD103-350?	Ada Lovelace AD103-300?	Ampere GA102-225	Ampere GA102-200
製造プロセス	TSMC 4N	TSMC 4N	Samsung 8nm	Samsung 8nm
ダイサイズ	~450mm2	~450mm2	628.4mm2	628.4mm2
トランジスタ数	不明	不明	28 Billion	28 Billion
CUDAコア数	10752?	9216?	10240	8704
TMU数 / ROP数	不明 / 224?	不明 / 214?	320 / 112	272 / 96
Tensor / RT コア数	不明 / 不明	不明 / 不明	320 / 80	272 / 68
ベースクロック	不明	不明	1365 MHz	1440 MHz
ブーストクロック	~2600 MHz	~2500 MHz	1665 MHz	1710 MHz
FP32演算性能	~55TFLOPs	~50 TFLOPs	34 TFLOPs	30 TFLOPs
RT TFLOPs	不明	不明	67 TFLOPs	58 TFLOPs
Tensor-TOPs	不明	不明	273 TOPs	238 TOPs
メモリ容量・種類	16 GB GDDR6X	16 GB GDDR6X	12 GB GDDR6X	10 GB GDDR6X
メモリバス幅	256-bit	256-bit	384-bit	320-bit
メモリ速度	24.0 Gbps?	21.0 Gbps?	19 Gbps	19 Gbps
メモリ帯域幅	768 GB/s	672 2GB/s	912 Gbps	760 Gbps
TGP	400W	350W	350W	320W
価格 (希望小売価格 / FE)	$1199 US?	$699 US?	$1199	$699 US
発売時期	2022?	2022/7	2021/06/03	2020/09/17

NVIDIA GeForce RTX 4070グラフィックスカードのパフォーマンス

ゲーミングGPUの性能については、発売が少し先なので、ここでは理論上の数字しか使えませんが、わかっていることからすると、RTX 4000シリーズのカードは、100TFLOPsの演算性能の制限に達する最初のゲーミングカードとなるかもしれません。

比較用の一覧：

NVIDIA GeForce RTX 4090 Ti：～103TFLOPs（FP32）（クロック2.8GHzと仮定した場合）
NVIDIA GeForce RTX 4090：～90TFLOPs（FP32）（クロック2.8GHzと仮定した場合）
NVIDIA GeForce RTX 4080：～50TFLOPs（FP32）（クロック2.5GHzと仮定した場合）
NVIDIA GeForce RTX 3090 Ti：40TFLOPs（FP32）（1.86GHzブーストクロック）
NVIDIA GeForce RTX 4070 Ti：～38TFLOPs（FP32）（クロック2.5GHzと仮定した場合）
NVIDIA GeForce RTX 4070：～36TFLOPs（FP32）（クロック2.5GHzと仮定した場合）
NVIDIA GeForce RTX 3090：36TFLOPs（FP32）（1.69GHzブーストクロック）
NVIDIA GeForce RTX 3080：30TFLOPs（FP32）（1.71GHzブーストクロック）
NVIDIA GeForce RTX 3070 Ti：22TFLOPs（FP32）（1.77GHzブーストクロック)
NVIDIA GeForce RTX 3070：20TFLOPs（FP32）（1.72GHzブーストクロック）

2.5GHzの理論値のクロックに基づくと、最大36TFLOPsの演算性能となり、噂ではさらに高いブーストクロックが示唆されています。

これは、AMDのピーク周波数が平均的な「ゲーム」クロックよりも高いのと同様に、ピーククロックのように聞こえるのは間違いない。

36+TFLOPsの演算性能は、「80クラスのフラッグシップ」よりも「70クラス」のGPUの方が性能が高いことを意味し、これは素晴らしい性能向上になるだろう。

しかし、演算性能は必ずしも全体のゲーム性能を示すものではないことを念頭に置く必要がある。

これは、GeForce RTX 4070グラフィックスカードがその前任者に対して約80%の計算性能の向上となり、それぞれの部門で大きな向上が期待されるRTおよびTensorコア性能を考慮するまでもないことです。

FLOPsは、必ずしもグラフィックスやゲームの性能を反映するものではありませんが、比較のための指標にはなります。

ゲーマーは、このグラフィックスカードで2Kゲームがバターのように滑らかになることを期待すべきですし、DLSSを有効にすれば、4K解像度でプレイ可能な60 FPSを見ることもできるかも知れません。

しかし、現実的に考えると、1440pのゲームタイトルがこのグラフィックカードのスイートスポットになるでしょう。

NVIDIA GeForce RTX 4070グラフィックスカードの価格と入手方法

NVIDIA GeForce RTX 3070は、499ドルで発売されましたが、そのリフレッシュは本当に価格を混乱させました。

RTX 3070 Tiは、標準モデルより100ドル高い599ドルで発売されましたが、追加料金に見合うだけの大きなパフォーマンスブーストは提供されていません。

NVIDIAは、500ドルのセグメントでより多くのゲーマーを確保する必要がありますが、価格に見合った製品を提供する必要があります。

RTX 2070とRTX 3070は少し物足りなく、前世代のフラッグシップとの差を縮めることはできましたが、GTX 1070の栄光を取り戻すことはまだできませんでした。

Ada Lovelaceアーキテクチャから期待される性能の飛躍により、RTX 4070は、米国で500ドルの価格帯の1つの輝かしいグラフィックスカードの選択肢となる可能性を持っています。

また、NVIDIAがリフレッシュを無視して、500ドルの価格帯でフルファットGA104構成を提供してくれるなら、それは非常識な価値であり、今後しばらくはこのクラスで最高のグラフィックスカードの1つになるでしょう。

NVIDIA GeForce RTX 40シリーズのグラフィックスカードは、7月中旬に公開され、2022年第3四半期に発売されると噂されているので、あと数ヶ月でNVIDIAが何をしようとしているのかがはっきり分かると思います。

NVIDIA GeForce GPUのセグメント/ティア価格

グラフィックセグメント	2014-2016	2016-2017	2017-2018	2018-2019	2019-2020	2020-2021	2021-2022
Titan クラス	Titan X (Maxwell)	Titan X (Pascal)	Titan Xp (Pascal)	Titan V (Volta)	Titan RTX (Turing)	GeForce RTX 3090	GeForce RTX 3090 Ti GeForce RTX 3090
価格	$999 US	$1199 US	$1199 US	$2999 US	$2499 US	$1499 US	$1999 US $1499 US
ウルトラエンスージアストクラス	GeForce GTX 980 Ti	GeForce GTX 980 Ti	GeForce GTX 1080 Ti	GeForce RTX 2080 Ti	GeForce RTX 2080 Ti	GeForce RTX 3080 Ti	GeForce RTX 3080 Ti
価格	$649 US	$649 US	$699 US	$999 US	$999 US	$1199 US	$1199 US
エンスージアストクラス	GeForce GTX 980	GeForce GTX 1080	GeForce GTX 1080	GeForce RTX 2080	GeForce RTX 2080 SUPER	GeForce RTX 3080 10 GB	GeForce RTX 3080 12 GB
価格	$549 US	$549 US	$549 US	$699 US	$699 US	$699 US	$999 US
ハイエンドクラス	GeForce GTX 970	GeForce GTX 1070	GeForce GTX 1070	GeForce RTX 2070	GeForce RTX 2070 SUPER	GeForce RTX 3070 Ti GeForce RTX 3070	GeForce RTX 3070 Ti 16 GB
価格	$329 US	$379 US	$379 US	$499 US	$499 US	$599 $499	未確認
メインストリームクラス	GeForce GTX 960	GeForce GTX 1060	GeForce GTX 1060	GeForce GTX 1060	GeForce RTX 2060 SUPER GeForce RTX 2060 GeForce GTX 1660 Ti GeForce GTX 1660 SUPER GeForce GTX 1660	GeForce RTX 3060 Ti GeForce RTX 3060 12 GB	GeForce RTX 3060 Ti GeForce RTX 3060 12 GB
価格	$199 US	$249 US	$249 US	$249 US	$399 US $349 US $279 US $229 US $219 US	$399 US $329 US	$399 US $329 US
エントリークラス	GTX 750 Ti GTX 750	GTX 950	GTX 1050 Ti GTX 1050	GTX 1050 Ti GTX 1050	GTX 1650 SUPER GTX 1650	GTX 1650 SUPER GTX 1650	RTX 3050
価格	$149 US $119 US	$149 US	$139 US $109 US	$139 US $109 US	$159 US $149 US	$159 US $149 US	$249 US

ソース：wccftech - NVIDIA GeForce RTX 4070 Graphics Card Specs, Performance, Price & Availability – Everything We Know So Far

解説：

RTX4070の性能予想記事です。

RTX3070の性能に基づいて、RTX3090とほぼ同等の性能になると予測されています。

面白いのはRTX4090/Tiのみが100TFLOPS近い性能で、RTX4080すらも50TFLOPS・・・つまり半分程度の性能と予測しているところですね。

性能から予想すると、RTX4090/TiとRTX4080の間には倍近い価格差があってもおかしくないということになります。

また、Ada Lovelaceで行われる性能向上の真の恩恵を受けられるのは非常に高価になると予想されるRTX4090/Tiを購入できる層のみと言うことになります。

次世代ゲーミングの真のパスポートの価格は非常に高価になるということです。

AmpereはFP32演算性能の割にはゲーム性能がかなり低かったですが、Ada Lovelaceはそうならないと私は見ています。

理由はRDNA2のインフィニティキャッシュのような大容量キャッシュが搭載されていることと、数々の改良が施されていることですかね。

巷で言われていたとおりゲームエンジンが増えたCUDAコアを使いきれていないのが理由だとしたら、Ampere発売から2年経った現在、そろそろ、爆発的にAmpereでブーストされる最新ゲームが出てもいいころではないかなと思います。

もしこのゲームエンジンが使いきれていないという理由が本当なら、Ada LovelaceもFP32演算性能の割にはゲーム性のヴか低くなるということになります。

そして、増えたCUDAコアに対応した最新のゲームエンジンでのみ爆発的にゲームの性能が高くなるという理屈になると思うのですが・・・。

[st_af id="7964"]