来週発売が予定されているNVIDIAの次期グラフィックスカード「GeForce RTX 3090 Ti」のファーストインプレッションがCapFrameXに掲載されました。
NVIDIA GeForce RTX 3090 Tiグラフィックスカードは、4K、2GHzクロックでRTX 3090に対して最大10%のパフォーマンスブーストを提供します。
フレームタイムキャプチャとハードウェア解析ツールの開発元であるCapframeXが投稿したインプレッションによると、NVIDIAのGeForce RTX 3090 Tiグラフィックスカードは4K解像度においてTiではない兄弟モデルよりも最大で10%の性能向上を実現するとのことです。
ゲームについては言及されていませんが、これがこのカードにとって最良のシナリオであるように聞こえます。
そのほか、このカードは2GHzまたはそれをわずかに超える周波数で動作すると言われており、これは素晴らしい性能向上につながるでしょう。
Some performance numbers RTX 3090 vs RTX 3090 Ti, first impression!
▶️ Ti ~10% faster at 4K
▶️ 450W power
▶️ 2GHz boost@BauduinSven @3DCenter_org @VideoCardz— CapFrameX (@CapFrameX) March 25, 2022
NVIDIAは、GeForce RTX 3090 Tiで、GA102 GPUに2つのSMを追加し(10752コア vs 10496コア)、より速いクロック速度(1860 MHz min boost)、より速いメモリ速度(21 Gbps GDDR6X)、より強力な冷却ソリューションと450 W TGP(同100 W増)を実現するために、全力を尽くそうとしています。
NVIDIA RTX 3090 Ti 24 GB グラフィックスカードの仕様
NVIDIA GeForce RTX 3090 Tiグラフィックスカードの心臓部には、GA102 GPUが搭載されています。
GA102は、NVIDIAが製造するフラッグシップゲーミングGPUであり、また最速のゲーミングGPUでもあります。
このGPUは、NVIDIAのために特別に設計されたSamsungの8nmカスタムプロセスノードをベースにしており、合計280億個のトランジスタを搭載しています。
その大きさは628mm2で、RTX 2080 TiとTitan RTXを搭載したTuring TU102 GPUのすぐ下、これまでに製造されたゲーミングGPUの中で2番目に大きいものとなっています。
※ 画像をクリックすると別Window・タブで開きます。
GeForce RTX 3090では、NVIDIAは、フラッグシップモデルで合計84個のSMユニットを有効にし、合計10752個のCUDAコアを実現しました(RTX 3090 Non-Tiでは82 SM / 10496コア)。
CUDAコアに加えて、NVIDIAのGeForce RTX 3090 Tiには、次世代RT(レイトレーシング)コア、Tensorコア、および全く新しいSM(ストリーミング・マルチプロセッサ)ユニットも搭載されています。
GPUは、ベースクロック1560MHz、ブーストクロック1860MHzで動作します。TDPは450W(RTX 3090から100W増加)。
メモリに関しては、GeForce RTX 3090 Tiは24GBのメモリを搭載しており、それも次世代GDDR6X設計です。
Micronの最新かつ最高のグラフィックスメモリダイにより、RTX 3090 Tiは21GbpsのGDDR6Xメモリ速度を提供することができます。
これは、384ビットのバスインターフェイスと合わせて、1008Gbpsの累積帯域幅を実現することになります。
NVIDIA GeForce RTX 3090 Tiグラフィックスカードは、最初のPCIe Gen 5.0準拠のグラフィックスカードであるとも噂されており、カードに最大600ワットの電力を供給できる単一の16ピン電源コネクタを搭載しています。
現在、いくつかのAIBでは、NVIDIAのFounder EditionのようにPCIe Gen 5.0コネクタを採用するか、それとも標準の8ピンコネクタを採用するかについて、内部で議論が続いているところです。
また、Founders Editionは、PG136Cと呼ばれるPG136 PCBボードの更新版と思われるものを利用する予定です。
NVIDIA GeForce RTX 3090 Ti 24 GBグラフィックスカードは、最新のNVENCエンコーダとNVCDECデコーダ、最新APIのサポート、第2世代レイレーシングコア、第3世代テンソルコアなど、最新のNV機能一式を搭載しています。
また、DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCサポートなど、最新のRTX機能をすべて搭載しています。
このグラフィックカードは、3月29日に発売され、無印モデルの既存の1499ドルの希望小売価格より大幅に割高になることが予想されます。
NVIDIA GeForce RTX 30シリーズ グラフィックスカード仕様:
グラフィック カード名 | NVIDIA GeForce RTX 3090 Ti | NVIDIA GeForce RTX 3090 | NVIDIA GeForce RTX 3080 Ti | NVIDIA GeForce RTX 3080 12 GB | NVIDIA GeForce RTX 3080 | NVIDIA GeForce RTX 3070 Ti | NVIDIA GeForce RTX 3070 | NVIDIA GeForce RTX 3060 Ti | NVIDIA GeForce RTX 3060 | NVIDIA GeForce RTX 3050 |
GPU名 | Ampere GA102-350? | Ampere GA102-300 | Ampere GA102-225 | Ampere GA102-220? | Ampere GA102-200 | Ampere GA104-400 | Ampere GA104-300 | Ampere GA104-200 | Ampere GA106-300 | Ampere GA106-150 Ampere GA107-300? |
製造プロセス | Samsung 8nm | Samsung 8nm | Samsung 8nm | Samsung 8nm | Samsung 8nm | Samsung 8nm | Samsung 8nm | Samsung 8nm | Samsung 8nm | Samsung 8nm |
ダイサイズ | 628.4mm2 | 628.4mm2 | 628.4mm2 | 628.4mm2 | 628.4mm2 | 395.2mm2 | 395.2mm2 | 395.2mm2 | 276mm2 | 276mm2 (GA106) |
トランジスタ 数 | 280億 | 280億 | 280億 | 280億 | 280億 | 174億 | 174億 | 174億 | 132.5億 | 132.5億 (GA106) |
CUDAコア数 | 10752 | 10496 | 10240 | 8960 | 8704 | 6144 | 5888 | 4864 | 3584 | 2560 |
TMUs / ROPs | 336 / 112 | 328 / 112 | 320 / 112 | 280/104 | 272 / 96 | 184 / 96 | 184 / 96 | 152 / 80 | 112 / 64 | 未確認 |
Tensor / RT コア数 | 336 / 84 | 328 / 82 | 320 / 80 | 280 / 70 | 272 / 68 | 184 / 46 | 184 / 46 | 152 / 38 | 112 / 28 | 未確認 |
ベース クロック | 1560 MHz | 1400 MHz | 1365 MHz | 1260 MHz | 1440 MHz | 1575 MHz | 1500 MHz | 1410 MHz | 1320 MHz | 1550 MHz |
ブースト クロック | 1860 MHz | 1700 MHz | 1665 MHz | 1710 MHz | 1710 MHz | 1770 MHz | 1730 MHz | 1665 MHz | 1780 MHz | 1780 MHz |
FP32演算性能 | 40 TFLOPS | 36 TFLOPs | 34 TFLOPs | 未確認 | 30 TFLOPs | 22 TFLOPs | 20 TFLOPs | 16 TFLOPs | 13 TFLOPs | 9.1 TFLOPs |
RT TFLOPs | 74 TFLOPS | 69 TFLOPs | 67 TFLOPs | 未確認 | 58 TFLOPs | 44 TFLOPs | 40 TFLOPs | 32 TFLOPs | 25 TFLOPs | 18.2 TFLOPS |
Tensor-TOPs | 未確認 | 285 TOPs | 273 TOPs | 未確認 | 238 TOPs | 183 TOPs | 163 TOPs | 192 TOPs | 101 TOPs | 72 TOPs |
メモリ容量 ・種類 | 24 GB GDDR6X | 24 GB GDDR6X | 12 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X | 8 GB GDDR6X | 8 GB GDDR6 | 8 GB GDDR6 | 12 GB GDDR6 | 8 GB GDDR6 |
メモリバス幅 | 384-bit | 384-bit | 384-bit | 384-bit | 320-bit | 256-bit | 256-bit | 256-bit | 192-bit | 128-bit |
メモリ速度 | 21 Gbps | 19.5 Gbps | 19 Gbps | 19 Gbps | 19 Gbps | 19 Gbps | 14 Gbps | 14 Gbps | 16 Gbps | 未確認 |
メモリ帯域幅 | 1008 GB/s | 936 GB/s | 912 Gbps | 912 Gbps | 760 GB/s | 608 GB/s | 448 GB/s | 448 GB/s | 384 GB/s | 未確認 |
TGP | 450W | 350W | 350W | 350W | 320W | 290W | 220W | 200W | 170W | 150W? |
価格 (FE版小売価格) | 不明 | $1499 US | $1199 | $999? | $699 US | $599 US | $499 US | $399 US | $329 US | $249 US |
発売時期 | 2022/3/29 | 2020/09/20 | 2021/07/03 | 2022/1/11 | 2020/09/17 | 2021/07/10 | 2020/10/29 | 2020/12/02 | 2021/02/25 | 2022/Q1? |
解説:
RX3090Tiは無印に対して10%の性能アップ。
予想外の性能アップで驚きました。
ただし、ここからOCマージンがどのくらいあるのかは疑問ですね。
TDP450Wと言うことでかなり重量級のグラフィックカードなわけですが、チップ自体のマージンや電源のマージンはどのくらい残っているのでしょうか?
元々3DMarkのHall of FameでRX6900XTに負けている状態なので、RTX3090Tiを出すことに決定したと考えています。
今一つはRTX4090/4080が600W、800Wと言う消費電力になるため、AIBが設計に慣れるための練習ともされています。
450W、2GHz近くまでクロックを上げて、10%の性能向上と言うのはなかなかの数字だと思いますが、ひのしろがどのくらいあるのかは疑問です。
この辺はSamsung8nmを採用したことが裏目に出ています。
生産性と性能、2つを天秤にかけて、生産性を取ったわけですからある意味仕方ないことなのかもしれません。
一応、RTX3090Tiのブーストクロックは1860MHzとされていますが、nVidiaiのGPUのブーストクロックは最低保証値で、後はそこから各モデルが採用している冷却ソリューションに応じてOCの限界値が決まます。
2.0GHz近くまでOCされるようですが、3.15GHzまでクロックが上げられるRX6900XTに勝てるとは思えませんし、メモリ性能などをもっと上げたRX6950XTの発売が控えていますので、RTX3090無印と比較して100W分シバくことの出来るRTX3090Tiの実力をもってしても約1GHzのアドバンテージのあるRX6950XTに勝つのは難しいのではないかと思います。
ここにきて「旧世代の製造プロセスを使ってもライバルに対して十分競争力があると考えている」と宣ったジェンセン・ヒューCEOの言葉が胸に刺さりますね(苦笑。
nVidia RTX4000SUPER
nVidia RTX4000
nVidia RTX3000シリーズGPU
RTX3060 12GB GDDR6
RTX3050 6GB