NVIDIA GeForce RTX 4070は、Ada Lovelace GPUをベースにした最新のグラフィックスアーキテクチャを提供する、次世代ハイエンドゲーミンググラフィックスカードになります。
このグラフィックスカードは、米国500ドルから600ドルの価格帯で非常に人気のあるゲーミンググラフィックスカードであるRTX 3070の後継となる予定です。
NVIDIA GeForce RTX 4070 Graphics Card - Purely Designed For Enthusiast Gamers(エンスージアスト・ゲーマー向け純国産グラフィックスカード
[更新日-22/05/28】
最高のゲーム性能を提供するハイエンドのGeForce RTX 4090 & GeForce RTX 4080シリーズグラフィックスカードの周りの熱気は否定できませんが、RTX 4070シリーズグラフィックスカードは、まだ手元に多くの性能を提供するハイエンド価格帯である500ドル米国セグメントを中心に設計される予定です。
単純な話、RTX 4090シリーズは金額を気にせず最高のものを求めるユーザー向け、RTX 4080シリーズは最高のゲーム性能をできるだけ安く求めるユーザー向けとなります。
RTX 4070は、ハイエンドゲーミングの最も使いやすい製品となり、非常に滑らかな2Kゲーム体験を提供します。
前作のGeForce RTX 3070は、RTX 2070から大きく進化し、RTX 2080 Tiよりも速いパフォーマンスを提供すると言われていましたが、RTX 3070 Tiだけが前回のTuring GPUフラッグシップのパフォーマンスを上回り、ほぼTuringフラッグシップと同等の性能でした。
RTX 4070も同じような位置づけで、RTX 3080 Tiと同等かそれに近いグラフィックス性能を提供しつつ、「Ti」バリエーションでグラフィックス性能をさらに先取りする可能性がありそうです。
次世代ゲーミングソリューションでも同様のことを期待したいところですが、考慮すべき重要な要素は、GPUがよりパワフルになり、より高価になってきているということです。
これは、より良い製品を手に入れるために将来も続くかもしれない傾向ですが、その代わり、エンドユーザーには常にコストが発生します。
そこで、これまでに分かっていることから始めると、まず、次世代GeForce RTX 40シリーズカードに搭載される全く新しいAda LovelaceまたはAD10*クラスのGPUを見てみる必要があります。
NVIDIAのAD104「Ada Lovelace」GPU - 次世代のパワーハウス
GPUの構成から説明すると、NVIDIA GeForce RTX 4070シリーズのグラフィックスカードは、GPUコア「AD104」を利用するとされていています。
このGPUは約300mm2の大きさで、グリーンチーム向けに設計されたTSMCの5nm(N5)ノードを最適化したTSMC 4Nプロセスノードを利用するとされています。
NVIDIA Ada Lovelace AD104 GPUは、最大5 GPC(Graphics Processing Clusters)を搭載する見込みです。
これは、GA104 GPUよりもGPCが1つ少ない。各GPUは、6個のTPCと2個のSMで構成され、これは従来のチップと同じ構成である。各SM(Streaming Multiprocessor)には、4つのサブコアが搭載されますが、これもGA102 GPUと同じです。
変更点は、FP32とINT32のコア構成です。各サブコアには128個のFP32が搭載されるが、FP32+INT32を合わせると最大192個になります。
これは、FP32ユニットがIN32ユニットと同じサブコアを共有しないためだ。128個のFP32コアは、64個のINT32コアとは別になっています。
つまり、各サブコアは、FP32ユニット32個とINT32ユニット16個、合計48個で構成されることになります。
各SMは、FP32ユニット128個とINT32ユニット64個、計192個を搭載することになります。
そして、SMは合計60基(GPCあたり12基)なので、FP32ユニット7,680基、INT32ユニット3,840基、合計11,520基のコアを持つことになります。
また、各SMには2つのWrap Schedules(32スレッド/CLK)が含まれ、SMあたり64ラップになります。
これはGA102 GPUと比較して、コア数(FP32+INT32)で50%、Wraps/Threadsで33%の増加となっています。
NVIDIA AD103 'Ada Lovelace' Gaming GPU 'SM'のブロック図(ソース:Kopite7kimi):
※ 画像をクリックすると、別Window・タブで拡大します。
キャッシュに話を移すと、ここもNVIDIAが既存のAmpere GPUに対して大きなブーストをかけた部分です。
Ada Lovelace GPUは、SMあたり192KBのL1キャッシュを搭載し、Ampereから50%増となります。
これは、トップのAD104 GPUでは、合計2MBのL1キャッシュを搭載することになります。
L2キャッシュは、リークにあるように48MBに増量されます。
これは、わずか4MBのL2キャッシュを搭載するAmpere GA104 GPUの12倍に相当する。このキャッシュはGPU全体で共有される予定です。
最後に、ROPですが、これも1GPCあたり32個に増え、Ampereの2倍になっています。
AmpereのGA104 GPUが96個であるのに対し、最大160個のROPを搭載することになります。
また、Ada Lovelace GPUには、最新の第4世代Tensorコアと第3世代RT(Raytracing)コアが搭載されており、DLSSとRaytracingのパフォーマンスを次のレベルに引き上げるのに役立ちます。
Ada Lovelace AD103 GPUは、全体として以下のような特徴を備えています。
- 5GPC vs GA104の6GPC
- コア数 +25% vs GA104 GPU
- 50%増のL1キャッシュ(Ampere GA104比)
- 2倍のL2キャッシュ(Ampere GA104比)
- +66% ROPs (Ampere GA104比)
- 第4世代Tensorコアと第3世代RTコア
NVIDIA AD104 'Ada Lovelace' ゲーミングGPUブロックダイアグラム・モックアップ(画像提供:SemiAnalysis):
※ 画像をクリックすると、別Window・タブで拡大します。
なお、2~3GHzとされるクロックは考慮されていないため、アンペアに対するコア単位の性能向上にも大きな役割を果たすことになります。
NVIDIA GeForce RTX 4070シリーズ速報スペック:
グラフィック カード名 | NVIDIA GeForce RTX 4070 Ti | NVIDIA GeForce RTX 4070 | NVIDIA GeForce RTX 3070 Ti | NVIDIA GeForce RTX 3070 |
GPU名 | AD104-400? | AD104-300? | Ampere GA104-400 | Ampere GA104-300 |
製造プロセス | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
ダイサイズ | ~300mm2 | ~300mm2 | 395.2mm2 | 395.2mm2 |
トランジスタ数 | 不明 | 不明 | 174億 | 174億 |
CUDAコア数 | ~7680 | ~7040 | 6144 | 5888 |
TMU数 / ROP数 | 不明 / 160 | 不明 / 144 | 192/ 96 | 184 / 96 |
Tensor / RT コア数 | 不明 / 不明 | 不明 / 不明 | 192/ 48 | 184 / 46 |
ベースクロック | 不明 | 不明 | 1575 MHz | 1500 MHz |
ブーストクロック | 不明 | 不明 | 1770 MHz | 1730 MHz |
FP32演算能力 | ~38 TFLOPs | ~36 TFLOPs | 22 TFLOPs | 20 TFLOPs |
RT TFLOPs | 不明 | 不明 | 42 TFLOPs | 40 TFLOPs |
Tensor-TOPs | 不明 | 不明 | 174 TOPs | 163 TOPs |
メモリ容量 ・種類 | 12 GB GDDR6X? | 12 GB GDDR6 | 8 GB GDDR6X | 8 GB GDDR6 |
メモリバス幅 | 192-bit | 192-bit | 256-bit | 256-bit |
メモリ速度 | 21 Gbps | 18 Gbps | 19 Gbps | 14 Gbps |
メモリ帯域幅 | 504 GB/s | 432 GB/s | 608 Gbps | 448 Gbps |
TGP | ~330W | ~300W | 290W | 220W |
価格 (希望 小売価格 / FE) | $599 US? | $499 US? | $599 US | $499 US |
発売時期 | 2022 | 2022 | 2021/06/10 | 2020/10/29 |
NVIDIA GeForce RTX 4070グラフィックスカードの仕様
GA104GPUで見たように、NVIDIAはGeForce RTX 4070シリーズのラインアップにAD104 GPUのさまざまな構成を用意することができます。
現実的には、RTX 4070とRTX 4070 Tiの2つのバリエーションがあると予想されます。
前者は初期ラインアップの一部となり、後者はミッドサイクルのリフレッシュとして発売されるでしょう。
最もエントリーレベルのGeForce RTX 3000は、フルチップと比較して23%少ないコア数でしたが、今回、「80クラス」のグラフィックスカードは、フラッグシップ機が使用するAD102 GPUに依存するのではなく、独自のチップが搭載される予定です。
そのため、6144から7680のフルコア構成になると予想されます。
NVIDIA GeForce RTX 4070の「予想される」仕様
NVIDIA GeForce RTX 4070は、RTX 3070 TI(6144コア)よりも若干コア数が多く、将来的にフルファット構成の「Ti」バリエーションが登場する余地があるカットダウン構成となる予定です。
このGPUは、48MBのL2キャッシュと最大160のROPsを搭載しており、まさに狂気の沙汰です。
クロックはまだ確定していませんが、TSMC 4Nプロセスが使用されていることを考慮すると、2.0~3.0GHzのクロックが予想されます。
通常より高いクロックは、Samsungの8nmノードのAmpere GPUが、実際には10nmプロセスノードにいくつかの最適化を施したものだったことを考えると、NVIDIAが2ノードジャンプをしていることが原因でしょう。
NVIDIAは、7nmをスキップして、5nmノードに直行し、無印モデルでもなく、その最適化バージョンにしようとしているのです。
TSMCの16nmノードのPascalで、NVIDIAは大幅な周波数の飛躍を実現しましたが、今回も同様の飛躍が期待できます。
メモリ仕様については、GeForce RTX 4070は12GB GDDR6を搭載し、192ビットバスインターフェースでより高速な18Gbpsの速度で動作すると予想されます。
これは、最大432GB/sの帯域幅を提供することになります。
このように仕様が強化されると、消費電力も高くなり、このフラッグシップモデルは約300WのTBPで動作すると予想されます。
300Wの場合、リファレンスモデルとカスタムモデルの両方で、16ピンのGen 5コネクタ1つで十分なはずです。
NVIDIA GeForce RTX 4070グラフィックスカードは、最新の第4世代Tensorコア、第3世代RTコア、最新のNVENCエンコーダ、NVCDECデコーダ、最新のAPIへの対応など、最新のNV機能セットをすべて搭載しています。
また、DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCのサポートなど、最新のRTX機能をすべて搭載しています。
NVIDIA GeForce RTX 4080シリーズ速報スペック:
グラフィックス カード名 | NVIDIA GeForce RTX 4080 Ti | NVIDIA GeForce RTX 4080 | NVIDIA GeForce RTX 3090 Ti | NVIDIA GeForce RTX 3080 |
GPU名 | Ada Lovelace AD103-350? | Ada Lovelace AD103-300? | Ampere GA102-225 | Ampere GA102-200 |
製造プロセス | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
ダイサイズ | ~450mm2 | ~450mm2 | 628.4mm2 | 628.4mm2 |
トランジスタ数 | 不明 | 不明 | 28 Billion | 28 Billion |
CUDAコア数 | 10752? | 9216? | 10240 | 8704 |
TMU数 / ROP数 | 不明 / 224? | 不明 / 214? | 320 / 112 | 272 / 96 |
Tensor / RT コア数 | 不明 / 不明 | 不明 / 不明 | 320 / 80 | 272 / 68 |
ベースクロック | 不明 | 不明 | 1365 MHz | 1440 MHz |
ブーストクロック | ~2600 MHz | ~2500 MHz | 1665 MHz | 1710 MHz |
FP32演算性能 | ~55TFLOPs | ~50 TFLOPs | 34 TFLOPs | 30 TFLOPs |
RT TFLOPs | 不明 | 不明 | 67 TFLOPs | 58 TFLOPs |
Tensor-TOPs | 不明 | 不明 | 273 TOPs | 238 TOPs |
メモリ容量 ・種類 | 16 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X |
メモリバス幅 | 256-bit | 256-bit | 384-bit | 320-bit |
メモリ速度 | 24.0 Gbps? | 21.0 Gbps? | 19 Gbps | 19 Gbps |
メモリ帯域幅 | 768 GB/s | 672 2GB/s | 912 Gbps | 760 Gbps |
TGP | 400W | 350W | 350W | 320W |
価格 (希望 小売価格 / FE) | $1199 US? | $699 US? | $1199 | $699 US |
発売時期 | 2022? | 2022/7 | 2021/06/03 | 2020/09/17 |
NVIDIA GeForce RTX 4070グラフィックスカードのパフォーマンス
ゲーミングGPUの性能については、発売が少し先なので、ここでは理論上の数字しか使えませんが、わかっていることからすると、RTX 4000シリーズのカードは、100TFLOPsの演算性能の制限に達する最初のゲーミングカードとなるかもしれません。
比較用の一覧:
- NVIDIA GeForce RTX 4090 Ti:~103TFLOPs(FP32)(クロック2.8GHzと仮定した場合)
- NVIDIA GeForce RTX 4090:~90TFLOPs(FP32)(クロック2.8GHzと仮定した場合)
- NVIDIA GeForce RTX 4080:~50TFLOPs(FP32)(クロック2.5GHzと仮定した場合)
- NVIDIA GeForce RTX 3090 Ti:40TFLOPs(FP32)(1.86GHzブーストクロック)
- NVIDIA GeForce RTX 4070 Ti:~38TFLOPs(FP32)(クロック2.5GHzと仮定した場合)
- NVIDIA GeForce RTX 4070:~36TFLOPs(FP32)(クロック2.5GHzと仮定した場合)
- NVIDIA GeForce RTX 3090:36TFLOPs(FP32)(1.69GHzブーストクロック)
- NVIDIA GeForce RTX 3080:30TFLOPs(FP32)(1.71GHzブーストクロック)
- NVIDIA GeForce RTX 3070 Ti:22TFLOPs(FP32)(1.77GHzブーストクロック)
- NVIDIA GeForce RTX 3070:20TFLOPs(FP32)(1.72GHzブーストクロック)
2.5GHzの理論値のクロックに基づくと、最大36TFLOPsの演算性能となり、噂ではさらに高いブーストクロックが示唆されています。
これは、AMDのピーク周波数が平均的な「ゲーム」クロックよりも高いのと同様に、ピーククロックのように聞こえるのは間違いない。
36+TFLOPsの演算性能は、「80クラスのフラッグシップ」よりも「70クラス」のGPUの方が性能が高いことを意味し、これは素晴らしい性能向上になるだろう。
しかし、演算性能は必ずしも全体のゲーム性能を示すものではないことを念頭に置く必要がある。
これは、GeForce RTX 4070グラフィックスカードがその前任者に対して約80%の計算性能の向上となり、それぞれの部門で大きな向上が期待されるRTおよびTensorコア性能を考慮するまでもないことです。
FLOPsは、必ずしもグラフィックスやゲームの性能を反映するものではありませんが、比較のための指標にはなります。
ゲーマーは、このグラフィックスカードで2Kゲームがバターのように滑らかになることを期待すべきですし、DLSSを有効にすれば、4K解像度でプレイ可能な60 FPSを見ることもできるかも知れません。
しかし、現実的に考えると、1440pのゲームタイトルがこのグラフィックカードのスイートスポットになるでしょう。
NVIDIA GeForce RTX 4070グラフィックスカードの価格と入手方法
NVIDIA GeForce RTX 3070は、499ドルで発売されましたが、そのリフレッシュは本当に価格を混乱させました。
RTX 3070 Tiは、標準モデルより100ドル高い599ドルで発売されましたが、追加料金に見合うだけの大きなパフォーマンスブーストは提供されていません。
NVIDIAは、500ドルのセグメントでより多くのゲーマーを確保する必要がありますが、価格に見合った製品を提供する必要があります。
RTX 2070とRTX 3070は少し物足りなく、前世代のフラッグシップとの差を縮めることはできましたが、GTX 1070の栄光を取り戻すことはまだできませんでした。
Ada Lovelaceアーキテクチャから期待される性能の飛躍により、RTX 4070は、米国で500ドルの価格帯の1つの輝かしいグラフィックスカードの選択肢となる可能性を持っています。
また、NVIDIAがリフレッシュを無視して、500ドルの価格帯でフルファットGA104構成を提供してくれるなら、それは非常識な価値であり、今後しばらくはこのクラスで最高のグラフィックスカードの1つになるでしょう。
NVIDIA GeForce RTX 40シリーズのグラフィックスカードは、7月中旬に公開され、2022年第3四半期に発売されると噂されているので、あと数ヶ月でNVIDIAが何をしようとしているのかがはっきり分かると思います。
NVIDIA GeForce GPUのセグメント/ティア価格
グラフィック セグメント | 2014-2016 | 2016-2017 | 2017-2018 | 2018-2019 | 2019-2020 | 2020-2021 | 2021-2022 |
Titan クラス | Titan X (Maxwell) | Titan X (Pascal) | Titan Xp (Pascal) | Titan V (Volta) | Titan RTX (Turing) | GeForce RTX 3090 | GeForce RTX 3090 Ti GeForce RTX 3090 |
価格 | $999 US | $1199 US | $1199 US | $2999 US | $2499 US | $1499 US | $1999 US $1499 US |
ウルトラ エンスージアスト クラス | GeForce GTX 980 Ti | GeForce GTX 980 Ti | GeForce GTX 1080 Ti | GeForce RTX 2080 Ti | GeForce RTX 2080 Ti | GeForce RTX 3080 Ti | GeForce RTX 3080 Ti |
価格 | $649 US | $649 US | $699 US | $999 US | $999 US | $1199 US | $1199 US |
エンスージアスト クラス | GeForce GTX 980 | GeForce GTX 1080 | GeForce GTX 1080 | GeForce RTX 2080 | GeForce RTX 2080 SUPER | GeForce RTX 3080 10 GB | GeForce RTX 3080 12 GB |
価格 | $549 US | $549 US | $549 US | $699 US | $699 US | $699 US | $999 US |
ハイエンド クラス | GeForce GTX 970 | GeForce GTX 1070 | GeForce GTX 1070 | GeForce RTX 2070 | GeForce RTX 2070 SUPER | GeForce RTX 3070 Ti GeForce RTX 3070 | GeForce RTX 3070 Ti 16 GB |
価格 | $329 US | $379 US | $379 US | $499 US | $499 US | $599 $499 | 未確認 |
メインストリーム クラス | GeForce GTX 960 | GeForce GTX 1060 | GeForce GTX 1060 | GeForce GTX 1060 | GeForce RTX 2060 SUPER GeForce RTX 2060 GeForce GTX 1660 Ti GeForce GTX 1660 SUPER GeForce GTX 1660 | GeForce RTX 3060 Ti GeForce RTX 3060 12 GB | GeForce RTX 3060 Ti GeForce RTX 3060 12 GB |
価格 | $199 US | $249 US | $249 US | $249 US | $399 US $349 US $279 US $229 US $219 US | $399 US $329 US | $399 US $329 US |
エントリー クラス | GTX 750 Ti GTX 750 | GTX 950 | GTX 1050 Ti GTX 1050 | GTX 1050 Ti GTX 1050 | GTX 1650 SUPER GTX 1650 | GTX 1650 SUPER GTX 1650 | RTX 3050 |
価格 | $149 US $119 US | $149 US | $139 US $109 US | $139 US $109 US | $159 US $149 US | $159 US $149 US | $249 US |
解説:
RTX4070の性能予想記事です。
RTX3070の性能に基づいて、RTX3090とほぼ同等の性能になると予測されています。
面白いのはRTX4090/Tiのみが100TFLOPS近い性能で、RTX4080すらも50TFLOPS・・・つまり半分程度の性能と予測しているところですね。
性能から予想すると、RTX4090/TiとRTX4080の間には倍近い価格差があってもおかしくないということになります。
また、Ada Lovelaceで行われる性能向上の真の恩恵を受けられるのは非常に高価になると予想されるRTX4090/Tiを購入できる層のみと言うことになります。
次世代ゲーミングの真のパスポートの価格は非常に高価になるということです。
AmpereはFP32演算性能の割にはゲーム性能がかなり低かったですが、Ada Lovelaceはそうならないと私は見ています。
理由はRDNA2のインフィニティキャッシュのような大容量キャッシュが搭載されていることと、数々の改良が施されていることですかね。
巷で言われていたとおりゲームエンジンが増えたCUDAコアを使いきれていないのが理由だとしたら、Ampere発売から2年経った現在、そろそろ、爆発的にAmpereでブーストされる最新ゲームが出てもいいころではないかなと思います。
もしこのゲームエンジンが使いきれていないという理由が本当なら、Ada LovelaceもFP32演算性能の割にはゲーム性のヴか低くなるということになります。
そして、増えたCUDAコアに対応した最新のゲームエンジンでのみ爆発的にゲームの性能が高くなるという理屈になると思うのですが・・・。
nVidia RTX4000SUPER
nVidia RTX4000
nVidia RTX3000シリーズGPU
RTX3060 12GB GDDR6
RTX3050 6GB