自作PCユーザーがゲーム用PCの解説をします

自作ユーザーが解説するゲーミングPCガイド

NVIDIA GeForce RTX 4070グラフィックスカードのスペック、性能、価格、発売日 – これまでに判明していることすべて

投稿日:

NVIDIA GeForce RTX 4070は、Ada Lovelace GPUをベースにした最新のグラフィックスアーキテクチャを提供する、次世代ハイエンドゲーミンググラフィックスカードになります。

このグラフィックスカードは、米国500ドルから600ドルの価格帯で非常に人気のあるゲーミンググラフィックスカードであるRTX 3070の後継となる予定です。

NVIDIA GeForce RTX 4070 Graphics Card – Purely Designed For Enthusiast Gamers(エンスージアスト・ゲーマー向け純国産グラフィックスカード
[更新日-22/05/28】

最高のゲーム性能を提供するハイエンドのGeForce RTX 4090 & GeForce RTX 4080シリーズグラフィックスカードの周りの熱気は否定できませんが、RTX 4070シリーズグラフィックスカードは、まだ手元に多くの性能を提供するハイエンド価格帯である500ドル米国セグメントを中心に設計される予定です。

単純な話、RTX 4090シリーズは金額を気にせず最高のものを求めるユーザー向け、RTX 4080シリーズは最高のゲーム性能をできるだけ安く求めるユーザー向けとなります。

RTX 4070は、ハイエンドゲーミングの最も使いやすい製品となり、非常に滑らかな2Kゲーム体験を提供します。

前作のGeForce RTX 3070は、RTX 2070から大きく進化し、RTX 2080 Tiよりも速いパフォーマンスを提供すると言われていましたが、RTX 3070 Tiだけが前回のTuring GPUフラッグシップのパフォーマンスを上回り、ほぼTuringフラッグシップと同等の性能でした。

RTX 4070も同じような位置づけで、RTX 3080 Tiと同等かそれに近いグラフィックス性能を提供しつつ、「Ti」バリエーションでグラフィックス性能をさらに先取りする可能性がありそうです。

次世代ゲーミングソリューションでも同様のことを期待したいところですが、考慮すべき重要な要素は、GPUがよりパワフルになり、より高価になってきているということです。

これは、より良い製品を手に入れるために将来も続くかもしれない傾向ですが、その代わり、エンドユーザーには常にコストが発生します。

そこで、これまでに分かっていることから始めると、まず、次世代GeForce RTX 40シリーズカードに搭載される全く新しいAda LovelaceまたはAD10*クラスのGPUを見てみる必要があります。

NVIDIAのAD104「Ada Lovelace」GPU – 次世代のパワーハウス

GPUの構成から説明すると、NVIDIA GeForce RTX 4070シリーズのグラフィックスカードは、GPUコア「AD104」を利用するとされていています。

このGPUは約300mm2の大きさで、グリーンチーム向けに設計されたTSMCの5nm(N5)ノードを最適化したTSMC 4Nプロセスノードを利用するとされています。

NVIDIA Ada Lovelace AD104 GPUは、最大5 GPC(Graphics Processing Clusters)を搭載する見込みです。

これは、GA104 GPUよりもGPCが1つ少ない。各GPUは、6個のTPCと2個のSMで構成され、これは従来のチップと同じ構成である。各SM(Streaming Multiprocessor)には、4つのサブコアが搭載されますが、これもGA102 GPUと同じです。

変更点は、FP32とINT32のコア構成です。各サブコアには128個のFP32が搭載されるが、FP32+INT32を合わせると最大192個になります。

これは、FP32ユニットがIN32ユニットと同じサブコアを共有しないためだ。128個のFP32コアは、64個のINT32コアとは別になっています。

つまり、各サブコアは、FP32ユニット32個とINT32ユニット16個、合計48個で構成されることになります。

各SMは、FP32ユニット128個とINT32ユニット64個、計192個を搭載することになります。

そして、SMは合計60基(GPCあたり12基)なので、FP32ユニット7,680基、INT32ユニット3,840基、合計11,520基のコアを持つことになります。

また、各SMには2つのWrap Schedules(32スレッド/CLK)が含まれ、SMあたり64ラップになります。

これはGA102 GPUと比較して、コア数(FP32+INT32)で50%、Wraps/Threadsで33%の増加となっています。

NVIDIA AD103 ‘Ada Lovelace’ Gaming GPU ‘SM’のブロック図(ソース:Kopite7kimi):

※ 画像をクリックすると、別Window・タブで拡大します。

 

キャッシュに話を移すと、ここもNVIDIAが既存のAmpere GPUに対して大きなブーストをかけた部分です。

Ada Lovelace GPUは、SMあたり192KBのL1キャッシュを搭載し、Ampereから50%増となります。

これは、トップのAD104 GPUでは、合計2MBのL1キャッシュを搭載することになります。

L2キャッシュは、リークにあるように48MBに増量されます。

これは、わずか4MBのL2キャッシュを搭載するAmpere GA104 GPUの12倍に相当する。このキャッシュはGPU全体で共有される予定です。

最後に、ROPですが、これも1GPCあたり32個に増え、Ampereの2倍になっています。

AmpereのGA104 GPUが96個であるのに対し、最大160個のROPを搭載することになります。

また、Ada Lovelace GPUには、最新の第4世代Tensorコアと第3世代RT(Raytracing)コアが搭載されており、DLSSとRaytracingのパフォーマンスを次のレベルに引き上げるのに役立ちます。

Ada Lovelace AD103 GPUは、全体として以下のような特徴を備えています。

  • 5GPC vs GA104の6GPC
  • コア数 +25% vs GA104 GPU
  • 50%増のL1キャッシュ(Ampere GA104比)
  • 2倍のL2キャッシュ(Ampere GA104比)
  • +66% ROPs (Ampere GA104比)
  • 第4世代Tensorコアと第3世代RTコア

NVIDIA AD104 ‘Ada Lovelace’ ゲーミングGPUブロックダイアグラム・モックアップ(画像提供:SemiAnalysis):

※ 画像をクリックすると、別Window・タブで拡大します。

 

なお、2~3GHzとされるクロックは考慮されていないため、アンペアに対するコア単位の性能向上にも大きな役割を果たすことになります。

NVIDIA GeForce RTX 4070シリーズ速報スペック:

グラフィック
カード名
NVIDIA GeForce
RTX 4070 Ti
NVIDIA GeForce
RTX 4070
NVIDIA GeForce
RTX 3070 Ti
NVIDIA GeForce
RTX 3070
GPU名 AD104-400? AD104-300? Ampere GA104-400 Ampere GA104-300
製造プロセス TSMC 4N TSMC 4N Samsung 8nm Samsung 8nm
ダイサイズ ~300mm2 ~300mm2 395.2mm2 395.2mm2
トランジスタ数 不明 不明 174億 174億
CUDAコア数 ~7680 ~7040 6144 5888
TMU数 / ROP数 不明 / 160 不明 / 144 192/ 96 184 / 96
Tensor / RT コア数 不明 / 不明 不明 / 不明 192/ 48 184 / 46
ベースクロック 不明 不明 1575 MHz 1500 MHz
ブーストクロック 不明 不明 1770 MHz 1730 MHz
FP32演算能力 ~38 TFLOPs ~36 TFLOPs 22 TFLOPs 20 TFLOPs
RT TFLOPs 不明 不明 42 TFLOPs 40 TFLOPs
Tensor-TOPs 不明 不明 174 TOPs 163 TOPs
メモリ容量
・種類
12 GB GDDR6X? 12 GB GDDR6 8 GB GDDR6X 8 GB GDDR6
メモリバス幅 192-bit 192-bit 256-bit 256-bit
メモリ速度 21 Gbps 18 Gbps 19 Gbps 14 Gbps
メモリ帯域幅 504 GB/s 432 GB/s 608 Gbps 448 Gbps
TGP ~330W ~300W 290W 220W
価格 (希望
小売価格 / FE)
$599 US? $499 US? $599 US $499 US
発売時期 2022 2022 2021/06/10 2020/10/29

NVIDIA GeForce RTX 4070グラフィックスカードの仕様

GA104GPUで見たように、NVIDIAはGeForce RTX 4070シリーズのラインアップにAD104 GPUのさまざまな構成を用意することができます。

現実的には、RTX 4070とRTX 4070 Tiの2つのバリエーションがあると予想されます。

前者は初期ラインアップの一部となり、後者はミッドサイクルのリフレッシュとして発売されるでしょう。

最もエントリーレベルのGeForce RTX 3000は、フルチップと比較して23%少ないコア数でしたが、今回、「80クラス」のグラフィックスカードは、フラッグシップ機が使用するAD102 GPUに依存するのではなく、独自のチップが搭載される予定です。

そのため、6144から7680のフルコア構成になると予想されます。

NVIDIA GeForce RTX 4070の「予想される」仕様

NVIDIA GeForce RTX 4070は、RTX 3070 TI(6144コア)よりも若干コア数が多く、将来的にフルファット構成の「Ti」バリエーションが登場する余地があるカットダウン構成となる予定です。

このGPUは、48MBのL2キャッシュと最大160のROPsを搭載しており、まさに狂気の沙汰です。

クロックはまだ確定していませんが、TSMC 4Nプロセスが使用されていることを考慮すると、2.0~3.0GHzのクロックが予想されます。

通常より高いクロックは、Samsungの8nmノードのAmpere GPUが、実際には10nmプロセスノードにいくつかの最適化を施したものだったことを考えると、NVIDIAが2ノードジャンプをしていることが原因でしょう。

NVIDIAは、7nmをスキップして、5nmノードに直行し、無印モデルでもなく、その最適化バージョンにしようとしているのです。

TSMCの16nmノードのPascalで、NVIDIAは大幅な周波数の飛躍を実現しましたが、今回も同様の飛躍が期待できます。

メモリ仕様については、GeForce RTX 4070は12GB GDDR6を搭載し、192ビットバスインターフェースでより高速な18Gbpsの速度で動作すると予想されます。

これは、最大432GB/sの帯域幅を提供することになります。

このように仕様が強化されると、消費電力も高くなり、このフラッグシップモデルは約300WのTBPで動作すると予想されます。

300Wの場合、リファレンスモデルとカスタムモデルの両方で、16ピンのGen 5コネクタ1つで十分なはずです。

NVIDIA GeForce RTX 4070グラフィックスカードは、最新の第4世代Tensorコア、第3世代RTコア、最新のNVENCエンコーダ、NVCDECデコーダ、最新のAPIへの対応など、最新のNV機能セットをすべて搭載しています。

また、DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCのサポートなど、最新のRTX機能をすべて搭載しています。

NVIDIA GeForce RTX 4080シリーズ速報スペック:

グラフィックス
カード名
NVIDIA GeForce
RTX 4080 Ti
NVIDIA GeForce
RTX 4080
NVIDIA GeForce
RTX 3090 Ti
NVIDIA GeForce
RTX 3080
GPU名 Ada Lovelace AD103-350? Ada Lovelace AD103-300? Ampere GA102-225 Ampere GA102-200
製造プロセス TSMC 4N TSMC 4N Samsung 8nm Samsung 8nm
ダイサイズ ~450mm2 ~450mm2 628.4mm2 628.4mm2
トランジスタ数 不明 不明 28 Billion 28 Billion
CUDAコア数 10752? 9216? 10240 8704
TMU数 / ROP数 不明 / 224? 不明 / 214? 320 / 112 272 / 96
Tensor / RT コア数 不明 / 不明 不明 / 不明 320 / 80 272 / 68
ベースクロック 不明 不明 1365 MHz 1440 MHz
ブーストクロック ~2600 MHz ~2500 MHz 1665 MHz 1710 MHz
FP32演算性能 ~55TFLOPs ~50 TFLOPs 34 TFLOPs 30 TFLOPs
RT TFLOPs 不明 不明 67 TFLOPs 58 TFLOPs
Tensor-TOPs 不明 不明 273 TOPs 238 TOPs
メモリ容量
・種類
16 GB GDDR6X 16 GB GDDR6X 12 GB GDDR6X 10 GB GDDR6X
メモリバス幅 256-bit 256-bit 384-bit 320-bit
メモリ速度 24.0 Gbps? 21.0 Gbps? 19 Gbps 19 Gbps
メモリ帯域幅 768 GB/s 672 2GB/s 912 Gbps 760 Gbps
TGP 400W 350W 350W 320W
価格 (希望
小売価格 / FE)
$1199 US? $699 US? $1199 $699 US
発売時期 2022? 2022/7 2021/06/03 2020/09/17

NVIDIA GeForce RTX 4070グラフィックスカードのパフォーマンス

ゲーミングGPUの性能については、発売が少し先なので、ここでは理論上の数字しか使えませんが、わかっていることからすると、RTX 4000シリーズのカードは、100TFLOPsの演算性能の制限に達する最初のゲーミングカードとなるかもしれません。

比較用の一覧:

  • NVIDIA GeForce RTX 4090 Ti:~103TFLOPs(FP32)(クロック2.8GHzと仮定した場合)
  • NVIDIA GeForce RTX 4090:~90TFLOPs(FP32)(クロック2.8GHzと仮定した場合)
  • NVIDIA GeForce RTX 4080:~50TFLOPs(FP32)(クロック2.5GHzと仮定した場合)
  • NVIDIA GeForce RTX 3090 Ti:40TFLOPs(FP32)(1.86GHzブーストクロック)
  • NVIDIA GeForce RTX 4070 Ti:~38TFLOPs(FP32)(クロック2.5GHzと仮定した場合)
  • NVIDIA GeForce RTX 4070:~36TFLOPs(FP32)(クロック2.5GHzと仮定した場合)
  • NVIDIA GeForce RTX 3090:36TFLOPs(FP32)(1.69GHzブーストクロック)
  • NVIDIA GeForce RTX 3080:30TFLOPs(FP32)(1.71GHzブーストクロック)
  • NVIDIA GeForce RTX 3070 Ti:22TFLOPs(FP32)(1.77GHzブーストクロック)
  • NVIDIA GeForce RTX 3070:20TFLOPs(FP32)(1.72GHzブーストクロック)

2.5GHzの理論値のクロックに基づくと、最大36TFLOPsの演算性能となり、噂ではさらに高いブーストクロックが示唆されています。

これは、AMDのピーク周波数が平均的な「ゲーム」クロックよりも高いのと同様に、ピーククロックのように聞こえるのは間違いない。

36+TFLOPsの演算性能は、「80クラスのフラッグシップ」よりも「70クラス」のGPUの方が性能が高いことを意味し、これは素晴らしい性能向上になるだろう。

しかし、演算性能は必ずしも全体のゲーム性能を示すものではないことを念頭に置く必要がある。

 

 

これは、GeForce RTX 4070グラフィックスカードがその前任者に対して約80%の計算性能の向上となり、それぞれの部門で大きな向上が期待されるRTおよびTensorコア性能を考慮するまでもないことです。

FLOPsは、必ずしもグラフィックスやゲームの性能を反映するものではありませんが、比較のための指標にはなります。

ゲーマーは、このグラフィックスカードで2Kゲームがバターのように滑らかになることを期待すべきですし、DLSSを有効にすれば、4K解像度でプレイ可能な60 FPSを見ることもできるかも知れません。

しかし、現実的に考えると、1440pのゲームタイトルがこのグラフィックカードのスイートスポットになるでしょう。

NVIDIA GeForce RTX 4070グラフィックスカードの価格と入手方法

NVIDIA GeForce RTX 3070は、499ドルで発売されましたが、そのリフレッシュは本当に価格を混乱させました。

RTX 3070 Tiは、標準モデルより100ドル高い599ドルで発売されましたが、追加料金に見合うだけの大きなパフォーマンスブーストは提供されていません。

NVIDIAは、500ドルのセグメントでより多くのゲーマーを確保する必要がありますが、価格に見合った製品を提供する必要があります。

RTX 2070とRTX 3070は少し物足りなく、前世代のフラッグシップとの差を縮めることはできましたが、GTX 1070の栄光を取り戻すことはまだできませんでした。

Ada Lovelaceアーキテクチャから期待される性能の飛躍により、RTX 4070は、米国で500ドルの価格帯の1つの輝かしいグラフィックスカードの選択肢となる可能性を持っています。

また、NVIDIAがリフレッシュを無視して、500ドルの価格帯でフルファットGA104構成を提供してくれるなら、それは非常識な価値であり、今後しばらくはこのクラスで最高のグラフィックスカードの1つになるでしょう。

NVIDIA GeForce RTX 40シリーズのグラフィックスカードは、7月中旬に公開され、2022年第3四半期に発売されると噂されているので、あと数ヶ月でNVIDIAが何をしようとしているのかがはっきり分かると思います。

NVIDIA GeForce GPUのセグメント/ティア価格

グラフィック
セグメント
2014-2016 2016-2017 2017-2018 2018-2019 2019-2020 2020-2021 2021-2022
Titan
クラス
Titan X
(Maxwell)
Titan X
(Pascal)
Titan Xp
(Pascal)
Titan V
(Volta)
Titan RTX
(Turing)
GeForce
RTX 3090
GeForce
RTX 3090 Ti
GeForce
RTX 3090
価格 $999 US $1199 US $1199 US $2999 US $2499 US $1499 US $1999 US
$1499 US
ウルトラ
エンスージアスト
クラス
GeForce
GTX 980 Ti
GeForce
GTX 980 Ti
GeForce
GTX 1080 Ti
GeForce
RTX 2080 Ti
GeForce
RTX 2080 Ti
GeForce
RTX 3080 Ti
GeForce
RTX 3080 Ti
価格 $649 US $649 US $699 US $999 US $999 US $1199 US $1199 US
エンスージアスト
クラス
GeForce
GTX 980
GeForce
GTX 1080
GeForce
GTX 1080
GeForce
RTX 2080
GeForce RTX
2080 SUPER
GeForce RTX
3080 10 GB
GeForce RTX
3080 12 GB
価格 $549 US $549 US $549 US $699 US $699 US $699 US $999 US
ハイエンド
クラス
GeForce
GTX 970
GeForce
GTX 1070
GeForce
GTX 1070
GeForce
RTX 2070
GeForce RTX
2070 SUPER
GeForce RTX
3070 Ti
GeForce RTX
3070
GeForce RTX
3070 Ti 16 GB
価格 $329 US $379 US $379 US $499 US $499 US $599
$499
未確認
メインストリーム
クラス
GeForce
GTX 960
GeForce
GTX 1060
GeForce
GTX 1060
GeForce
GTX 1060
GeForce RTX
2060 SUPER
GeForce RTX
2060
GeForce GTX
1660 Ti
GeForce GTX
1660 SUPER
GeForce GTX
1660
GeForce RTX
3060 Ti
GeForce RTX
3060 12 GB
GeForce RTX
3060 Ti
GeForce RTX
3060 12 GB
価格 $199 US $249 US $249 US $249 US $399 US
$349 US
$279 US
$229 US
$219 US
$399 US
$329 US
$399 US
$329 US
エントリー
クラス
GTX 750 Ti
GTX 750
GTX 950 GTX 1050 Ti
GTX 1050
GTX 1050 Ti
GTX 1050
GTX 1650
SUPER
GTX 1650
GTX 1650
SUPER
GTX 1650
RTX 3050
価格 $149 US
$119 US
$149 US $139 US
$109 US
$139 US
$109 US
$159 US
$149 US
$159 US
$149 US
$249 US

ソース:wccftech – NVIDIA GeForce RTX 4070 Graphics Card Specs, Performance, Price & Availability – Everything We Know So Far

 

 

 

解説:

RTX4070の性能予想記事です。

RTX3070の性能に基づいて、RTX3090とほぼ同等の性能になると予測されています。

面白いのはRTX4090/Tiのみが100TFLOPS近い性能で、RTX4080すらも50TFLOPS・・・つまり半分程度の性能と予測しているところですね。

性能から予想すると、RTX4090/TiとRTX4080の間には倍近い価格差があってもおかしくないということになります。

また、Ada Lovelaceで行われる性能向上の真の恩恵を受けられるのは非常に高価になると予想されるRTX4090/Tiを購入できる層のみと言うことになります。

次世代ゲーミングの真のパスポートの価格は非常に高価になるということです。

AmpereはFP32演算性能の割にはゲーム性能がかなり低かったですが、Ada Lovelaceはそうならないと私は見ています。

理由はRDNA2のインフィニティキャッシュのような大容量キャッシュが搭載されていることと、数々の改良が施されていることですかね。

巷で言われていたとおりゲームエンジンが増えたCUDAコアを使いきれていないのが理由だとしたら、Ampere発売から2年経った現在、そろそろ、爆発的にAmpereでブーストされる最新ゲームが出てもいいころではないかなと思います。

もしこのゲームエンジンが使いきれていないという理由が本当なら、Ada LovelaceもFP32演算性能の割にはゲーム性のヴか低くなるということになります。

そして、増えたCUDAコアに対応した最新のゲームエンジンでのみ爆発的にゲームの性能が高くなるという理屈になると思うのですが・・・。

 

 

 

  • B!