NVIDIAの次期RTX 3060 Tiは、最近になってそのフルスペックがリークされたことが確認され、今では発売日も決まっているようです。
MyDrivers.com (Videocardz経由)によると、GA104ベースのRTX 3060 Tiは11月17日に発売される予定です。
我々はまた、我々の情報源から同じことを聞いた(より具体的には, これは禁輸解除日であること)、したがって、これは噂としてタグ付けされていません – Jensenができるし、おそらくリークシーンを混乱させるためだけに日付を少しの周りに移動しますが.NVIDIA RTX 3060 Tiは11月17日に発表されます
NVIDIA GeForce RTX 3060 Ti」は、GPUに4864個のCUDAコアを搭載したGA104-200 GPUと、14GbpsクロックのGDDR6メモリ8GBを搭載する。バス幅は256bitで、合計帯域幅は448GB/sとなる。ボードが必要とする電力が少なくなるため、TBPは約200Wで、リファレンスデザインのクロックは約180Wです。
これは、175WのRTX 2070と比較して5Wの増加であり、TSMCのノードと比較した場合の電力効率の面でSamsungのノードが相当すると推測できます。
NVIDIAのRTX3090およびRTX3080カードのパフォーマンスが直線的にスケーリングしない理由は、これだけの量のコアを処理するように設計されていないゲームエンジンおよびバイナリによるボトルネックが原因であることに注意してください。
大量のグラフィックスパワーを処理するように設計されたvRAYやOctaneなどのソフトウェアでのこれらのカードのベンチマークパフォーマンスにより、ハードウェアとドライバーのスタックは直線的にスケーリングすることがわかっています。
これは、コアをスケールダウンしても、パフォーマンスが直線的にスケールダウンしないことを意味します。
実際、私はRTX 3060TiがRTX2080のクロックよりも優れていることを非常に期待しています。
RTX 2080 Tiよりもわずかに落ちるクロックを想定すると、以前のフラッグシップと簡単に性能を追い抜けるはずです。
RTX 3060 Tiシリーズのカードは非常に長い間開発が進められてきましたが、Videocardzもようやくその確認が取れました。
RTXの完全なラインナップは次のとおりです:
NVIDIA GeForce RTX 30シリーズ「Ampere」グラフィックスカードの仕様
グラフィック カード名 |
NVIDIA GeForce RTX 3060 Ti |
NVIDIA GeForce RTX 3070 |
NVIDIA GeForce RTX 3070 Ti? |
NVIDIA GeForce RTX 3080 |
NVIDIA GeForce RTX 3090 |
GPU アーキテクチャー チップ型番 |
Ampere GA104-200 | Ampere GA104-300 | Ampere GA102-150 | Ampere GA102-200 | Ampere GA102-300 |
製造プロセス | Samsung 8nm | Samsung 8nm | Samsung 8nm | Samsung 8nm | Samsung 8nm |
ダイサイズ | 395.2mm2 | 395.2mm2 | 628.4mm2 | 628.4mm2 | 628.4mm2 |
トランジスタ数 | 174億 | 174億 | 280億 | 280億 | 280億 |
CUDA数 | 4864 | 5888 | 7424 | 8704 | 10496 |
TMU数 / ROP数 |
未確認 | 184 / 96 | 232 / 80 | 272 / 96 | 328 / 112 |
Tensor / RT コア数 |
152 / 38 | 184 / 46 | 232 / 58 | 272 / 68 | 328 / 82 |
ベースクロック | 1410 MHz | 1500 MHz | 未確認 | 1440 MHz | 1400 MHz |
ブーストクロック | 1665 MHz | 1730 MHz | 未確認 | 1710 MHz | 1700 MHz |
FP32 演算性能 | 16.2 TFLOPS | 20 TFLOPs | 未確認 | 30 TFLOPs | 36 TFLOPs |
RT 演算性能 | 32.4 TFLOPS | 40 TFLOPs | 未確認 | 58 TFLOPs | 69 TFLOPs |
Tensor-TOPs | 未確認 | 163 TOPs | 未確認 | 238 TOPs | 285 TOPs |
メモリ容量 ・種類 |
8 GB GDDR6 | 8 GB GDDR6 | 10 GB GDDR6X? | 10 GB GDDR6X | 24 GB GDDR6X |
メモリバス幅 | 256-bit | 256-bit | 320-bit | 320-bit | 384-bit |
メモリ速度 | 14 Gbps | 14 Gbps | 320-bit | 19 Gbps | 19.5 Gbps |
メモリ帯域幅 | 448 Gbps | 448 Gbps | 320-bit | 760 Gbps | 936 Gbps |
TDP | 180W? | 220W | 250-280W | 320W | 350W |
小売価格 (FE版・米ドル |
$399 US? | $499 US | $599 US? | $699 US | $1499 US |
発売日 | 2020/11/17? | 2020/10/29 | 不明 | 2020/09/17 | 2020/09/24 |
AMDは最近10月28日にNavi22シリーズを発売しました。
これが、NVIDIAがTiベースのモデルを最初に発売することを決定した理由の1つである可能性があります。
3080および3090カードはまだ在庫がないため、ゲーマーは明らかに次世代GPUを手に入れたいと切望しています。
ああ、NVIDIAで何が起こっているのか疑問に思っているなら、私はあなたのためにいくつかの美味しい詳細を持っています。
サムスン8nmノードの最初のいくつかのバッチの歩留まりは予想よりも低く、高価です。 同社は、今後数か月で歩留まり(したがってウェーハの価格)が大幅に向上すると予想しています。
株主を保護するために、同社は最初の数バッチの注文に注意を払い、その後のバッチの注文を大幅に増やしました。
この問題は、ボットが最初からボリューム全体を吸い上げることによってさらに悪化しました。
ホリデーシーズンの前に大量注文が発生し始めると予想されます(もちろん、マイニング野郎がそれをすべて飲み込んでいないと仮定します)。
ソース:wccftech – NVIDIA GeForce RTX 3060 Ti Will Be Announced On November 17th
解説:
本文中にちょっと無視できない箇所があったので、ネットを漁ってデータを拾ってきました。
その個所と言うのはここです。
NVIDIAのRTX3090およびRTX3080カードのパフォーマンスが直線的にスケーリングしない理由は、これだけの量のコアを処理するように設計されていないゲームエンジンおよびバイナリによるボトルネックが原因であることに注意してください。
大量のグラフィックスパワーを処理するように設計されたvRAYやOctaneなどのソフトウェアでのこれらのカードのベンチマークパフォーマンスにより、ハードウェアとドライバーのスタックは直線的にスケーリングすることがわかっています。
これは、コアをスケールダウンしても、パフォーマンスが直線的にスケールダウンしないことを意味します。
だとしたらnVidiaらしからぬとても間抜けな話です。
最低でも3DMarkには反映されるように努力すべきです。
参考:GPUについて
のベンチマーク一覧にもありますが
1W当たりのスコア
RTX3090 TimeSpy・・・57、FireStrikeExtreme・・・69
RTX3080 TimeSpy・・・56、FireStrikeExtreme・・66
RTX3070 TimeSpy・・・63、FireStrikeExtreme・・78
となっています。今のところ電力当たりの効率はRTX3070が一番優れているという結果になっています。
私は巨大なダイを身の丈に合わないクロックで動かしていたからだと思っていたのですが、どうも違うようです。
ではvRAYの結果を見てみましょう
vRAY BenchMark (Million Per Path)
RTX3080 10GB ・・・638
RTX2080Ti 11GB・・・365
RTX3080:RTX2080Ti=1.75:1
CUDAコア比
RTX3080:RTX2080Ti=2:1
FP32演算能力比
RTX3080:RTX2080Ti=2.21:1
となり、別に綺麗にスケーリングはされていないような気がします。
CGのレンダリングは動画のエンコードと並んでGPUがもっとも得意とする作業の一つです。
この手の作業の場合は、GPUのスケールに綺麗に比例することが多いです。
そのCGのレンダリングにおいてもCUDAコア数比やクロックも考慮に入っている公称FP32演算性能比でちゃんと比率通りになっていないというのはちょっとどうなのかなと思います。
あまり正確なものの見方ではないと感じます。
それとも、ソフト側がうまく生かしきれてないと言うことなのでしょうか。
と言うわけで話は少しRTX3060Tiから横道にそれましたが、AmpereがCUDAコア数やFP32演算性能で比較するとあまり性能が出ない点に関して、少し見てみました。
ソフト側が対応を進めればFP32演算性能比かCUDAコア数比と同じくらいの結果になるのかもしれませんが、少なくとも現時点ではそうではないようです。