NVIDIAのGeForce RTX 4070 Tiグラフィックスカードの疑惑の仕様が明らかになり、RTX 3090 Tiに匹敵する性能になるかもしれないとのことです。
NVIDIA GeForce RTX 4070 Tiは7680コア、12GB GDDR6XメモリでRTX 3090 Tiの性能に匹敵するとの疑惑が浮上
リークしたKopite7kimi氏によると、NVIDIA GeForce RTX 4070 Tiは、既存のフラッグシップであるGeForce RTX 3090 Tiに匹敵するパフォーマンスを提供する、怪物カードに仕上がるかもしれないとのことです。
リーカーは、いくつかの新しい仕様について報告し、4070シリーズは、前任者よりもはるかに高い電力制限の恩恵を受けることになるようです。
As I have mentioned before, there is an AD104 SKU with a 400W limit.
PG141-SKU331
a full-fat AD104 with 7680FP32
21Gbps 12G GDDR6X
It can easily match RTX 3090 Ti.— kopite7kimi (@kopite7kimi) August 1, 2022
NVIDIA GeForce RTX 4070の「予想される」仕様
NVIDIA GeForce RTX 4070 Tiは、7680コアまたは60SMユニットのフルAD104 GPUコアを利用すると予想されています。
以前のリークから、AD104 GPUは48MBのL2キャッシュと最大160ROPsを搭載することも分かっており、これはまさに狂気の沙汰です。
これは、GA104 GPUコアを搭載するGeForce RTX 3070 Tiに対して、コア数が25%増加し、キャッシュが12倍増加することになります。
クロックはまだ確定していないが、TSMC 4Nプロセスが採用されていることを考えると、2.0~3.0GHzレンジのクロックが予想される。
通常より高いクロックが期待できるのは、Samsungの8nmノードを採用したAmpere GPUが、実際には10nmプロセスノードにいくつかの最適化を施したものだったことを考えると、NVIDIAが2ノードジャンプをしていることが理由でしょう。
NVIDIAは、7nmをスキップして、5nmノードを使用し、そのまま使うのではなく、その最適化バージョンにしようとしているのです。
TSMCの16nmノードのPascalで、NVIDIAは大幅な周波数の飛躍を実現しましたが、今回も同様のジャンプが期待できます。
メモリ仕様としては、GeForce RTX 4070 Tiは12GBのGDDR6Xを搭載し、192ビットバスインターフェースで21Gbpsのクロックで504GB/sの帯域幅になると言われている。
RTX 4070は300WのTBPとなると予想されていますが、RTX 4070 Tiは400Wという高い消費電力上限となるでしょう。
Founders Editionが325~350Wという消費電力上限値となるため、これはカスタムモデルの電力上限値になる可能性があります。
このグラフィックスカードは、PG141-SKU331 PCB設計によるものと予想されています。
NVIDIA GeForce RTX 4070シリーズ速報スペック:
グラフィック カード名 | NVIDIA GeForce RTX 4070 Ti | NVIDIA GeForce RTX 4070 | NVIDIA GeForce RTX 3070 Ti | NVIDIA GeForce RTX 3070 |
GPU名 | AD104-400? | AD104-300? | Ampere GA104-400 | Ampere GA104-300 |
製造プロセス | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
ダイサイズ | ~300mm2 | ~300mm2 | 395.2mm2 | 395.2mm2 |
トランジスタ数 | 不明 | 不明 | 174億 | 174億 |
PCB | NVIDIA PG141-SKU331 | NVIDIA PG141-310 SKU341 | NVIDIA PG141 | NVIDIA PG142 |
CUDAコア数 | ~7680 | ~7040 | 6144 | 5888 |
TMU数 / ROP数 | 不明 / 160 | 不明 / 144 | 192/ 96 | 184 / 96 |
Tensor / RT コア数 | 不明 / 不明 | 不明 / 不明 | 192/ 48 | 184 / 46 |
ベースクロック | 不明 | 不明 | 1575 MHz | 1500 MHz |
ブーストクロック | 不明 | 不明 | 1770 MHz | 1730 MHz |
FP32演算性能 | ~38 TFLOPs | ~36 TFLOPs | 22 TFLOPs | 20 TFLOPs |
RT TFLOPs | 不明 | 不明 | 42 TFLOPs | 40 TFLOPs |
Tensor-TOPs | 不明 | 不明 | 174 TOPs | 163 TOPs |
メモリ容量 ・種類 | 12 GB GDDR6X? | 12 GB GDDR6 | 8 GB GDDR6X | 8 GB GDDR6 |
メモリバス幅 | 192-bit | 192-bit | 256-bit | 256-bit |
メモリ速度 | 21 Gbps | 18 Gbps | 19 Gbps | 14 Gbps |
メモリ帯域 | 504 GB/s | 432 GB/s | 608 Gbps | 448 Gbps |
TGP | ~400W | ~300W | 290W | 220W |
価格 (希望小売 価格 / FE) | $599 US? | $499 US? | $599 US | $499 US |
発売時期 | 2022 | 2022 | 2021/07/10 | 2020/10/29 |
解説:
RTX4070TiはRTX3090Tiと同等の性能
AD102とGA102を比較するとCUDAコア数18432に対して10752と+71%増となっています。
AD104はGA104から+25%増と増加率はさほど大したことはありません。
それでもRTX3090と同等レベルの性能が発揮できるのはTSMC4Nを使うことによってクロックを飛躍的に上げられるからなのでしょう。
Ada Lovelaceの性能はクロックに依存している部分が大きいですが、肝心のクロックがまだ公開されていませんので、性能に関しては想像するしかないレベルです。
今のところCUDAコア数はあまり多くはないということになります。
こうして考えるとAD102は別格の性能になるとみてよいでしょう。
RTX4080Ti(もしくはSUPER)がAD103なのかAD102なのかによりますが、AD102搭載モデルで安いものが出れば、それが一番コスパが良いということになりそうです。
RTX3080Tiの発売時期から見ても恐らく発売される派の2023年中になると思われます。
Ampereの在庫が余っているため、発売が2023年にずれ込むのではないかと言われているRTX4080/4070ですが、私は2022年のクリスマス時期を外すとはちょっと思えません。
nVidia RTX4000SUPER
nVidia RTX4000
nVidia RTX3000シリーズGPU
RTX3060 12GB GDDR6
RTX3050 6GB