NVIDIA GeForce RTX 4060は、Ada Lovelace GPUをベースにした最新のグラフィックスアーキテクチャを提供する、次世代ハイエンドゲーミンググラフィックスカードとなります。
このグラフィックスカードは、米国300ドルから400ドルのセグメントで非常に人気のあるゲーミンググラフィックスカードであるRTX 3060の後継となる予定です。
NVIDIA GeForce RTX 4070グラフィックスカードは純粋にエンスージアストゲーマーのために設計されていたが・・・・
[更新日-28/05/22】
最高のゲーム性能を提供するハイエンドのGeForce RTX 4090、GeForce RTX 4080、GeForce RTX 4070シリーズグラフィックスカードの熱気は否定できないが、RTX 4060シリーズグラフィックスカードは、手元に多くの性能を提供しながらもメインストリーム価格帯となる300~400ドルのセグメント向けに設計される。
単純な話、RTX 4090シリーズは金額を気にせず最高のものを求めるユーザー向け、RTX 4080シリーズは最高のパフォーマンスを可能な限り低価格で求めるユーザー向けとなります。
RTX 4070はハイエンドゲーミングのスイートスポットとなり、RTX 4060は大勢のゲーマーを対象に、その性能から無視できない価格で提供されることになります。
前身のGeForce RTX 3060は、RTX 2080 SUPERを大きく上回る性能を提供すると謳われていました。
このカードは結局、約束された性能目標を達成しましたが、RTX 2060 SUPERと比較すると、せいぜい25~30%の性能向上でした。
これは主に、RTX 2060 SUPERがすでにRTX 2060のアップグレード版であったことに起因する。
しかし、RTX 2000シリーズ以降、RTX 3000はそれまでになかったTiと無印のモデル名が存在しました。
RTX 3060 Tiは、RTX 3060と比較して30%程度高速化しました。
また、RTX 3060 Tiは、RTX 2060 SUPERよりも30%、標準のRTX 2060よりも40~45%高速だった。
一方、RTX 3060 Non-Tiは、RTX 2060 SUPERよりも10%程度、RTX 2060 Non-SUPERのグラフィックスカードよりも20%程度速かった。
つまり、性能から言えば、RTX 3060 Tiは確かに高速だが、価格も高いが、それでも結局は前モデルに対してより良い価値を提供することになった。
例えば、RTX 3060 TiとRTX 2060 SUPERの希望小売価格はともに399USドルでしたが、3060 Tiの方が30%速い性能を提供しています。
一方、RTX 3060 Non-Tiは、RTX 2060 Non-SUPERよりも20米ドル安かったが、性能は20%向上している。
RTX 3060はFounders Editionのバリエーションが発売されなかったため、ほとんどのモデルは15~20ドル高く販売されており、結局のところ、RTX 2060 Non-SUPERと同じ価格で20%のアップリフトを実現していることになる。
NVIDIAがゲームユーザーを説得するために行ったことは、RTX 3060グラフィックスカードに、RTX 3060 Tiの8GBに対して12GBのメモリを搭載させることでした。
このカードは、Tiの256ビットバスに対して192ビットバスと、より低い帯域幅を採用しているため、性能に大きな変化はありませんでした。
次世代ゲーミングソリューションでも同様のことが予想されますが、考慮すべき重要な要素は、GPUがよりパワフルになり、より高価になってきているということです。
これは、より良い製品を手に入れるために将来も続くかもしれない傾向ですが、その代わり、エンドユーザーには常にコストがかかります。
そこで、これまでに分かっていることから始めると、まず、次世代GeForce RTX 40シリーズカードに搭載される全く新しいAda LovelaceまたはAD10*クラスのGPUを見てみる必要があります。
NVIDIAのAD106「Ada Lovelace」GPU – 次世代のパワーハウス
GPUの構成から説明すると、NVIDIA GeForce RTX 4060シリーズのグラフィックスカードは、AD104とAD106の両方のGPUを利用する可能性がある。
その理由は、現行のGeForce RTX 30シリーズの状況と同じで、RTX 3060 TiがGA104 GPUを、RTX 3060がGA106 GPUをベースにしているためだ。
AD104 GPUについては、すでにこちらで詳しく紹介しているので、AD106 GPUの内容&特徴を見ていこう。
GPUのサイズは約200mm2で、グリーンチーム向けに設計されたTSMCの5nm(N5)ノードの最適化バージョンであるTSMC 4Nプロセスノードを利用すると言われています。
NVIDIA Ada Lovelace AD106 GPUは、最大3 GPC(Graphics Processing Clusters)を搭載する見込みです。
これは、GA106 GPUと同じGPC数である。各GPUは、6個のTPCと2個のSMで構成され、これは従来のチップと同じ構成である。
各SM(Streaming Multiprocessor)には、4つのサブコアが搭載されますが、これもGA106 GPUと同じです。変更点は、FP32とINT32のコア構成です。
各サブコアには128個のFP32が搭載されるが、FP32+INT32を合わせると最大192個になる。
これは、FP32ユニットがIN32ユニットと同じサブコアを共有しないためだ。128個のFP32コアは、64個のINT32コアとは別になっている。
つまり、各サブコアは、FP32ユニット32個とINT32ユニット16個、合計48個で構成されることになる。
各SMは、FP32ユニット128個とINT32ユニット64個、計192個を搭載することになる。そして、SMは合計36基(GPCあたり12基)あるので、FP32ユニットが4608基、INT32ユニットが2304基、合計6912基のコアがあることになる。
また、各SMには2つのWrap Schedules(32スレッド/CLK)が含まれ、SMあたり64ラップになります。これはGA102 GPUと比較して、コア数(FP32+INT32)で50%、Wraps/Threadsで33%の増加となっています。
NVIDIA AD103 ‘Ada Lovelace’ Gaming GPU ‘SM’のブロック図(画像提供:Kopite7kimi):
※ 画像をクリックすると別Window・タブで拡大します。
キャッシュに話を移すと、ここもNVIDIAが既存のAmpere GPUに対して大きなブーストをかけた部分である。
Ada Lovelace GPUは、SMあたり192KBのL1キャッシュを搭載し、Ampereから50%増となる。L2キャッシュは、リークにあるように32MBに増量される。
これは、3MBのL2キャッシュしか持たないAmpere GA106 GPUの10.6倍に相当する。このキャッシュはGPU全体で共有される予定です。
最後に、ROPsですが、これはGPCあたり16個にとどまるでしょう。現在のGA106 GPUと同じ、最大48個のROPを見ることができます。
また、Ada Lovelace GPUには、最新の第4世代Tensorコアと第3世代RT(レイトレーシング)コアが搭載されており、DLSSとレイトレーシングのパフォーマンスを次のレベルに引き上げるのに役立ちます。
Ada Lovelace AD106 GPUは、次のような特徴を備えています。
- GA106 GPUと同じGPC数
- +GA106 GPUと比較して20%増のコア数
- 50%増のL1キャッシュ(Ampere GA106と比較)
- 10倍以上のL2キャッシュ(Ampere GA106と比較)
- 同じ ROPs 数(Ampere GA106 と比較して)
- 第4世代Tensorコアと第3世代RTコア
NVIDIA AD106 ‘Ada Lovelace’ ゲーミング GPU ブロックダイアグラムの模式図(画像出典:SemiAnalysis):
なお、2~3GHzとされるクロックは考慮されていないため、Ampereに対するコア単位の性能向上にも大きな役割を果たすことになる。
参考 – NVIDIA GeForce RTX 4070シリーズ速報スペック:
グラフィック カード名 |
NVIDIA GeForce RTX 4070 Ti |
NVIDIA GeForce RTX 4070 |
NVIDIA GeForce RTX 3070 Ti |
NVIDIA GeForce RTX 3070 |
GPU名 | AD104-400? | AD104-300? | Ampere GA104-400 | Ampere GA104-300 |
製造プロセス | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
ダイサイズ | ~300mm2 | ~300mm2 | 395.2mm2 | 395.2mm2 |
トランジスタ数 | 不明 | 不明 | 174億 | 174億 |
CUDAコア数 | ~7680 | ~7040 | 6144 | 5888 |
TMU数 / ROP数 | 不明 / 160 | 不明 / 144 | 192/ 96 | 184 / 96 |
Tensor / RT コア数 | 不明 / 不明 | 不明 / 不明 | 192/ 48 | 184 / 46 |
ベースクロック | 不明 | 不明 | 1575 MHz | 1500 MHz |
ブーストクロック | 不明 | 不明 | 1770 MHz | 1730 MHz |
FP32演算能力 | ~38 TFLOPs | ~36 TFLOPs | 22 TFLOPs | 20 TFLOPs |
RT TFLOPs | 不明 | 不明 | 42 TFLOPs | 40 TFLOPs |
Tensor-TOPs | 不明 | 不明 | 174 TOPs | 163 TOPs |
メモリ容量 ・種類 |
12 GB GDDR6X? | 12 GB GDDR6 | 8 GB GDDR6X | 8 GB GDDR6 |
メモリバス幅 | 192-bit | 192-bit | 256-bit | 256-bit |
メモリ速度 | 21 Gbps | 18 Gbps | 19 Gbps | 14 Gbps |
メモリ帯域幅 | 504 GB/s | 432 GB/s | 608 Gbps | 448 Gbps |
TGP | ~330W | ~300W | 290W | 220W |
価格 (希望 小売価格 / FE) |
$599 US? | $499 US? | $599 US | $499 US |
発売時期 | 2022 | 2022 | 2021/06/10 | 2020/10/29 |
NVIDIA GeForce RTX 4060グラフィックスカードの仕様
GeForce RTX 3060シリーズで見たように、RTX 4060シリーズのグラフィックカードは2つの異なる構成になる可能性があります。
現実的には、RTX 4060とRTX 4060 Tiの2つのバリエーションがあると予想されます。
既存世代では、RTX 3060 TiとRTX 3060が数カ月間隔でリリースされ、これは大量に売れるモデルなので、NVIDIAは、300~350ドル前後と400~450ドル前後の2つの製品をメインストリームゲーマーに提供することになるでしょう。
現在のところ、AD104 GPUがGeForce RTX 4060シリーズ内で利用されるかどうかは不明なので、AD106 GPUを利用する標準的なRTX 4060に見ていきましょう。
NVIDIA GeForce RTX 4060の「予想される」スペック
NVIDIAは、RTX 4060シリーズのラインナップをAD104/AD106のミックスにするか、AD106にするかを決定したことから、TiがAD104の構成をカットして使用できるのに対し、カットダウンしたRTX 4060かフル構成のものを見ることができます。
AD106 GPUは、32MBのL2キャッシュと最大48個のROPを搭載する。
クロックはまだ確定していないが、TSMC 4Nプロセスが採用されていることを考えると、2.0~3.0GHz台のクロックが予想される。通常より高いクロックは、Samsungの8nmノードを採用したAmpere GPUが、実際には10nmプロセスノードにいくつかの最適化を施したものだったことを考えると、NVIDIAが2ノードジャンプをしていることに由来する。
NVIDIAは、7nmをスキップして、5nmノードを採用し、無印モデルですらなく、その最適化バージョンにしようとしているのです。
TSMCの16nmノードのPascalで、NVIDIAは大きな周波数の飛躍を実現しましたが、今回も同様のジャンプが期待できます。
https://twitter.com/kopite7kimi/status/1533350037425893376?ref_src=twsrc%5Etfw
メモリの仕様については、GeForce RTX 4060は、320GB/s以上の帯域幅のために128ビットバスインタフェース全体でより速い20+ Gbps速度で来るかもしれない8GB GDDR6Xの容量を揺することが期待されています。
「Ti」モデルは、それがAD104 GPUであるなら、192-bitバスインターフェイス全体で最大12GBのメモリを提供する可能性があります。
GeForce RTX 4060グラフィックスカードは、RTX 3060よりも30%、RTX 3060 Tiよりも10%向上した220WのTGPを誇ると言われている。
これは大規模なTGPの増加であり、NVIDIAが効率性の数字を維持するためには、性能が非常に良くなる必要があります。
NVIDIA GeForce RTX 4060グラフィックスカードは、最新の第4世代テンソルコア、第3世代RTコア、最新のNVENCエンコーダ、NVCDECデコーダ、最新のAPIへの対応など、最新のNV機能セットをすべて搭載しています。
また、DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCサポートなど、最新のRTX機能をすべて搭載しています。
NVIDIA GeForce RTX 4060シリーズ速報スペック:
グラフィック カード名 |
NVIDIA GeForce RTX 4060 Ti |
NVIDIA GeForce RTX 4060 |
NVIDIA GeForce RTX 3060 Ti |
NVIDIA GeForce RTX 3060 |
GPU名 | Ada Lovelace AD104? | Ada Lovelace AD106 | Ampere GA104-200 | Ampere GA106-300 |
製造プロセス | TSCM 4N | TSCM 4N | Samsung 8nm | Samsung 8nm |
ダイサイズ | ~300mm2 | ~200mm2 | 395.2mm2 | 不明 |
トランジスタ数 | 不明 | 不明 | 174億 | 不明 |
CUDAコア数 | 5,120? | 4,608 | 4,864 | 3,584 |
TMUs / ROPs | 不明 / 64 | 不明 / 48 | 152 / 80 | 112 / 64 |
Tensor / RT コア数 |
不明 | 不明 | 152 / 38 | 112 / 28 |
ベースクロック | 不明 | 不明 | 1410 MHz | 1320 MHz |
ブーストクロック | 2.2-2.6 GHz | 2.2-2.6 GHz | 1665 MHz | 1780 MHz |
FP32演算性能 | ~24 TFLOPs | ~21 TFLOPs | 16 TFLOPs | 13 TFLOPs |
RT TFLOPs | 不明 | 不明 | 32 TFLOPs | 25 TFLOPs |
Tensor-TOPs | 不明 | 不明 | 192 TOPs | 101 TOPs |
メモリ容量 | 12 GB GDDR6? |
8 GB GDDR6? |
8 GB GDDR6 |
12 GB GDDR6 |
メモリバス幅 | 192-bit | 128-bit | 256-bit | 192-bit |
メモリ速度 | 不明 | 不明 | 14 Gbps | 16 Gbps |
メモリ帯域幅 | >448 GB/s | >320 GB/s | 448 Gbps | 384 Gbps |
TGP | ~265W | ~220W | 175W | 170W |
価格 (希望 小売価格 / FE) |
~$399 US | ~$329 US | $399 US | $329 US |
発売時期 | 2023H1 | 2023H1 | 2020/12/02 | 2021/01/25 |
NVIDIA GeForce RTX 4060グラフィックスカードのパフォーマンス
ゲーミングGPUの性能については、発売が少し先なので、ここでは理論上の数字しか使えませんが、わかっていることからすると、RTX 40シリーズのカードは、100TFLOPsの演算性能に達する最初のゲーミングカードとなるかもしれません。
比較用として:
- NVIDIA GeForce RTX 4090 Ti:~103TFLOPs(FP32)(2.8GHzのクロックを想定しています)
- NVIDIA GeForce RTX 4090:~90TFLOPs(FP32)(2.8GHzのクロックを想定しています)
- NVIDIA GeForce RTX 4080:~50TFLOPs(FP32)(2.5GHzクロックを想定しています)
- NVIDIA GeForce RTX 3090 Ti:40TFLOPs(FP32)(1.86GHzのブーストクロック)
- NVIDIA GeForce RTX 4070 Ti:~38TFLOPs(FP32)(2.5GHzのクロックを想定しています)
- NVIDIA GeForce RTX 4070:~36TFLOPs(FP32)(2.5GHzのクロックを想定しています)
- NVIDIA GeForce RTX 3090:36TFLOPs(FP32)(1.69GHzのブーストクロック)
- NVIDIA GeForce RTX 3080:30TFLOPs(FP32)(1.71GHzのブーストクロック)
- NVIDIA GeForce RTX 3070 Ti:22TFLOPs(FP32)(1.77GHzのブーストクロック)
- NVIDIA GForce RTX 4060:20TFLOPs(FP32)(2.2GHzのクロックを想定しています)
- NVIDIA GeForce RTX 3070:20TFLOPs(FP32)(1.72GHzのブーストクロック)
- NVIDIA GeForce RTX 3060 Ti:16TFLOPs(FP32)(1.65GHzのブーストクロック)
- NVIDIA GeForce RTX 3060:13TFLOPs(FP32)(1.77GHzのブーストクロック)
2.2GHzのクロック想定して計算すると、最大20TFLOPsの演算性能を得ることができ、噂ではさらに高いブーストクロックが示唆されています。
これは、AMDのピーク周波数が平均的な「ゲーム」クロックよりも高いのと同様に、ピーククロックのように見えるでしょう。
20TFLOPs以上の演算性能は、「70クラスのフラッグシップ」よりも「60クラス」のGPUの方が性能が高いことを意味し、これは良い性能ジャンプとなるだろう。
しかし、演算性能は必ずしも全体のゲーム性能を示すものではないことを念頭に置く必要がある。
これは、GeForce RTX 4060グラフィックスカードが、その前身モデルに対して約54%の計算性能の性能向上となり、これは、それぞれに大きな性能向上が期待されるRTおよびTensorコア性能を考慮するまでもなくです。
FLOPsは、必ずしもグラフィックスやゲームの性能を反映するものではありませんが、比較のための指標にはなります。
ゲーマーは、これらのグラフィックスカードとDLSSで、素晴らしい1080p、さらには1440pゲームがバタフライのように滑らかになることを期待するはずです。
「60」シリーズは、常にプレミアム1080pおよびメインストリーム1440pゲームを対象としていますが、これらのカードは、Reflex、DLSS、およびメインストリーム価格帯の様々なストリーミング機能などの技術により、eスポーツの間で相当に人気が出ることを期待しています。
NVIDIA GeForce RTX 4060グラフィックスカードの価格と入手方法
NVIDIA GeForce RTX 3060は329USドルで発売され、RTX 3060 Tiは399USドルで発売された。NVIDIAは、これらのカードについて、10ドルから20ドルの価格調整をあちこちで行いながら、同じ価格を維持すると予想されます。
NVIDIAは、300ドルから400ドルのセグメントでより多くのゲーマーを確保する必要がありますが、価格に見合った製品を提供する必要があるのです。
RTX 3060 Tiはまともな製品でしたが、RTX 3060はAMD Radeon RX 6600シリーズに対して非常に競争力があることを証明しました。
あとは、NVIDIAがメインストリーム・キングの地位を維持したいのか、それともゲーマーや彼ら自身の利益にはならないような路線で行くのか、その決断次第となります。
NVIDIA GeForce RTX 40シリーズのグラフィックスカードは、第3四半期に公開され、2022年第4四半期に発売されると噂されているので、あと数ヶ月でNVIDIAが何をしようとしているのかがはっきり分かるでしょう。
NVIDIA GeForce GPUのセグメント/ティア価格
グラフィック セグメント |
2014-2016 | 2016-2017 | 2017-2018 | 2018-2019 | 2019-2020 | 2020-2021 | 2021-2022 |
Titan クラス |
Titan X (Maxwell) |
Titan X (Pascal) |
Titan Xp (Pascal) |
Titan V (Volta) |
Titan RTX (Turing) |
GeForce RTX 3090 |
GeForce RTX 3090 Ti GeForce RTX 3090 |
価格 | $999 US | $1199 US | $1199 US | $2999 US | $2499 US | $1499 US | $1999 US $1499 US |
ウルトラ エンスージアスト クラス |
GeForce GTX 980 Ti |
GeForce GTX 980 Ti |
GeForce GTX 1080 Ti |
GeForce RTX 2080 Ti |
GeForce RTX 2080 Ti |
GeForce RTX 3080 Ti |
GeForce RTX 3080 Ti |
価格 | $649 US | $649 US | $699 US | $999 US | $999 US | $1199 US | $1199 US |
エンスージアスト クラス |
GeForce GTX 980 |
GeForce GTX 1080 |
GeForce GTX 1080 |
GeForce RTX 2080 |
GeForce RTX 2080 SUPER |
GeForce RTX 3080 10 GB |
GeForce RTX 3080 12 GB |
価格 | $549 US | $549 US | $549 US | $699 US | $699 US | $699 US | $999 US |
ハイエンド クラス |
GeForce GTX 970 |
GeForce GTX 1070 |
GeForce GTX 1070 |
GeForce RTX 2070 |
GeForce RTX 2070 SUPER |
GeForce RTX 3070 Ti GeForce RTX 3070 |
GeForce RTX 3070 Ti 16 GB |
価格 | $329 US | $379 US | $379 US | $499 US | $499 US | $599 $499 |
未確認 |
メインストリーム クラス |
GeForce GTX 960 |
GeForce GTX 1060 |
GeForce GTX 1060 |
GeForce GTX 1060 |
GeForce RTX 2060 SUPER GeForce RTX 2060 GeForce GTX 1660 Ti GeForce GTX 1660 SUPER GeForce GTX 1660 |
GeForce RTX 3060 Ti GeForce RTX 3060 12 GB |
GeForce RTX 3060 Ti GeForce RTX 3060 12 GB |
価格 | $199 US | $249 US | $249 US | $249 US | $399 US $349 US $279 US $229 US $219 US |
$399 US $329 US |
$399 US $329 US |
エントリー クラス |
GTX 750 Ti GTX 750 |
GTX 950 | GTX 1050 Ti GTX 1050 |
GTX 1050 Ti GTX 1050 |
GTX 1650 SUPER GTX 1650 |
GTX 1650 SUPER GTX 1650 |
RTX 3050 |
価格 | $149 US $119 US |
$149 US | $139 US $109 US |
$139 US $109 US |
$159 US $149 US |
$159 US $149 US |
$249 US |
解説:
RTX4060の情報が出てきました。
RTX4060はRTX3070/Ti程度の性能になるが、220Wになります。
これは小型PCファンにとっては痛いTDPです。
Ampereの時17-20cm弱のカード長のモデルが出たのは
TDP200WのRTX3060Tiまで
でした。
シングルファンと全長20cm弱の小ぶりなヒートシンクで冷やせる限界は200Wまでと言うことになります。
冷却パーツと言うのは新しく設計しなおしたからと言って性能が倍になるということはまずありえません。
そのため、220WのTGPを誇るRTX4060のMini-ITX向けのモデルは出ないかもしれません。
大ヒットして今でもSteam使用率ナンバーワンを誇るGTX1060は価格や消費電力と性能のバランスが非常に良かったのですが、Turing以降、XX60モデルのラインナップでのコスパとワッパはパッとしなくなりました。
RTX3060/Tiなどはあまりにも高価になり過ぎてミドルレンジとは言えない価格にまでなってしまいました。
RTX4060は消費電力の面では既にミドルレンジとは言えないレベルですが、価格の方は是非期待させていただきたいところです。
性能に関しては元の記事を見るとRTX2080Ti≒RTX3070/Ti≒RTX4060/Ti程度になると思います。
Ada Lovelace世代ではミドルレンジのRTX4060/TiですらもGTX1080Tiより高性能になるということになります。
私の感想としては「TSMC 4Nを使用する割には思ったより性能が低いな」と感じてしまいます。
やはり、既に飽和気味のラスタライズ性能のテコ入れはそこそこにしてTensorコアやRTコアに力を入れているのでしょうね。
なんにせよ、今出ているのは理論値ですので、実際はまだどうなるのかはハッキリしていません。
さらなるスペックを確定するには続報を待つしかないでしょう。