NVIDIA GeForce RTX 3060 Tiは11月17日に発表されます - 自作ユーザーが解説するゲーミングPCガイド

NVIDIAの次期RTX 3060 Tiは、最近になってそのフルスペックがリークされたことが確認され、今では発売日も決まっているようです。

MyDrivers.com (Videocardz経由)によると、GA104ベースのRTX 3060 Tiは11月17日に発売される予定です。

我々はまた、我々の情報源から同じことを聞いた（より具体的には, これは禁輸解除日であること）、したがって、これは噂としてタグ付けされていません - Jensenができるし、おそらくリークシーンを混乱させるためだけに日付を少しの周りに移動しますが.NVIDIA RTX 3060 Tiは11月17日に発表されます

NVIDIA GeForce RTX 3060 Ti」は、GPUに4864個のCUDAコアを搭載したGA104-200 GPUと、14GbpsクロックのGDDR6メモリ8GBを搭載する。バス幅は256bitで、合計帯域幅は448GB/sとなる。ボードが必要とする電力が少なくなるため、TBPは約200Wで、リファレンスデザインのクロックは約180Wです。

これは、175WのRTX 2070と比較して5Wの増加であり、TSMCのノードと比較した場合の電力効率の面でSamsungのノードが相当すると推測できます。

NVIDIAのRTX3090およびRTX3080カードのパフォーマンスが直線的にスケーリングしない理由は、これだけの量のコアを処理するように設計されていないゲームエンジンおよびバイナリによるボトルネックが原因であることに注意してください。

大量のグラフィックスパワーを処理するように設計されたvRAYやOctaneなどのソフトウェアでのこれらのカードのベンチマークパフォーマンスにより、ハードウェアとドライバーのスタックは直線的にスケーリングすることがわかっています。

これは、コアをスケールダウンしても、パフォーマンスが直線的にスケールダウンしないことを意味します。

実際、私はRTX 3060TiがRTX2080のクロックよりも優れていることを非常に期待しています。

RTX 2080 Tiよりもわずかに落ちるクロックを想定すると、以前のフラッグシップと簡単に性能を追い抜けるはずです。

RTX 3060 Tiシリーズのカードは非常に長い間開発が進められてきましたが、Videocardzもようやくその確認が取れました。

RTXの完全なラインナップは次のとおりです:

NVIDIA GeForce RTX 30シリーズ「Ampere」グラフィックスカードの仕様

グラフィックカード名	NVIDIA GeForce RTX 3060 Ti	NVIDIA GeForce RTX 3070	NVIDIA GeForce RTX 3070 Ti?	NVIDIA GeForce RTX 3080	NVIDIA GeForce RTX 3090
GPU アーキテクチャーチップ型番	Ampere GA104-200	Ampere GA104-300	Ampere GA102-150	Ampere GA102-200	Ampere GA102-300
製造プロセス	Samsung 8nm	Samsung 8nm	Samsung 8nm	Samsung 8nm	Samsung 8nm
ダイサイズ	395.2mm2	395.2mm2	628.4mm2	628.4mm2	628.4mm2
トランジスタ数	174億	174億	280億	280億	280億
CUDA数	4864	5888	7424	8704	10496
TMU数 / ROP数	未確認	184 / 96	232 / 80	272 / 96	328 / 112
Tensor / RT コア数	152 / 38	184 / 46	232 / 58	272 / 68	328 / 82
ベースクロック	1410 MHz	1500 MHz	未確認	1440 MHz	1400 MHz
ブーストクロック	1665 MHz	1730 MHz	未確認	1710 MHz	1700 MHz
FP32 演算性能	16.2 TFLOPS	20 TFLOPs	未確認	30 TFLOPs	36 TFLOPs
RT 演算性能	32.4 TFLOPS	40 TFLOPs	未確認	58 TFLOPs	69 TFLOPs
Tensor-TOPs	未確認	163 TOPs	未確認	238 TOPs	285 TOPs
メモリ容量・種類	8 GB GDDR6	8 GB GDDR6	10 GB GDDR6X?	10 GB GDDR6X	24 GB GDDR6X
メモリバス幅	256-bit	256-bit	320-bit	320-bit	384-bit
メモリ速度	14 Gbps	14 Gbps	320-bit	19 Gbps	19.5 Gbps
メモリ帯域幅	448 Gbps	448 Gbps	320-bit	760 Gbps	936 Gbps
TDP	180W?	220W	250-280W	320W	350W
小売価格 (FE版・米ドル	$399 US?	$499 US	$599 US?	$699 US	$1499 US
発売日	2020/11/17?	2020/10/29	不明	2020/09/17	2020/09/24

AMDは最近10月28日にNavi22シリーズを発売しました。

これが、NVIDIAがTiベースのモデルを最初に発売することを決定した理由の1つである可能性があります。

3080および3090カードはまだ在庫がないため、ゲーマーは明らかに次世代GPUを手に入れたいと切望しています。

ああ、NVIDIAで何が起こっているのか疑問に思っているなら、私はあなたのためにいくつかの美味しい詳細を持っています。

サムスン8nmノードの最初のいくつかのバッチの歩留まりは予想よりも低く、高価です。同社は、今後数か月で歩留まり（したがってウェーハの価格）が大幅に向上すると予想しています。

株主を保護するために、同社は最初の数バッチの注文に注意を払い、その後のバッチの注文を大幅に増やしました。

この問題は、ボットが最初からボリューム全体を吸い上げることによってさらに悪化しました。

ホリデーシーズンの前に大量注文が発生し始めると予想されます（もちろん、マイニング野郎がそれをすべて飲み込んでいないと仮定します）。

ソース：wccftech - NVIDIA GeForce RTX 3060 Ti Will Be Announced On November 17th

解説：

本文中にちょっと無視できない箇所があったので、ネットを漁ってデータを拾ってきました。

その個所と言うのはここです。

NVIDIAのRTX3090およびRTX3080カードのパフォーマンスが直線的にスケーリングしない理由は、これだけの量のコアを処理するように設計されていないゲームエンジンおよびバイナリによるボトルネックが原因であることに注意してください。
大量のグラフィックスパワーを処理するように設計されたvRAYやOctaneなどのソフトウェアでのこれらのカードのベンチマークパフォーマンスにより、ハードウェアとドライバーのスタックは直線的にスケーリングすることがわかっています。
これは、コアをスケールダウンしても、パフォーマンスが直線的にスケールダウンしないことを意味します。

だとしたらnVidiaらしからぬとても間抜けな話です。

最低でも3DMarkには反映されるように努力すべきです。

参考：GPUについて

のベンチマーク一覧にもありますが

1W当たりのスコア

RTX3090 TimeSpy・・・57、FireStrikeExtreme・・・69

RTX3080 TimeSpy・・・56、FireStrikeExtreme・・66

RTX3070 TimeSpy・・・63、FireStrikeExtreme・・78

となっています。今のところ電力当たりの効率はRTX3070が一番優れているという結果になっています。

私は巨大なダイを身の丈に合わないクロックで動かしていたからだと思っていたのですが、どうも違うようです。

ではvRAYの結果を見てみましょう

vRAY BenchMark (Million Per Path)

RTX3080 10GB ・・・638

RTX2080Ti 11GB・・・365

RTX3080：RTX2080Ti=1.75:1

CUDAコア比

RTX3080：RTX2080Ti=2:1

FP32演算能力比

RTX3080：RTX2080Ti=2.21:1

となり、別に綺麗にスケーリングはされていないような気がします。

CGのレンダリングは動画のエンコードと並んでGPUがもっとも得意とする作業の一つです。

この手の作業の場合は、GPUのスケールに綺麗に比例することが多いです。

そのCGのレンダリングにおいてもCUDAコア数比やクロックも考慮に入っている公称FP32演算性能比でちゃんと比率通りになっていないというのはちょっとどうなのかなと思います。

あまり正確なものの見方ではないと感じます。

それとも、ソフト側がうまく生かしきれてないと言うことなのでしょうか。

と言うわけで話は少しRTX3060Tiから横道にそれましたが、AmpereがCUDAコア数やFP32演算性能で比較するとあまり性能が出ない点に関して、少し見てみました。

ソフト側が対応を進めればFP32演算性能比かCUDAコア数比と同じくらいの結果になるのかもしれませんが、少なくとも現時点ではそうではないようです。

[st_af id="7964"]