自作PCユーザーがゲーム用PCの解説をします

自作ユーザーが解説するゲーミングPCガイド

NVIDIA GeForce RTX 3060 Tiは11月17日に発表されます

更新日:

NVIDIAの次期RTX 3060 Tiは、最近になってそのフルスペックがリークされたことが確認され、今では発売日も決まっているようです。

MyDrivers.com (Videocardz経由)によると、GA104ベースのRTX 3060 Tiは11月17日に発売される予定です。

我々はまた、我々の情報源から同じことを聞いた(より具体的には, これは禁輸解除日であること)、したがって、これは噂としてタグ付けされていません – Jensenができるし、おそらくリークシーンを混乱させるためだけに日付を少しの周りに移動しますが.NVIDIA RTX 3060 Tiは11月17日に発表されます

NVIDIA GeForce RTX 3060 Ti」は、GPUに4864個のCUDAコアを搭載したGA104-200 GPUと、14GbpsクロックのGDDR6メモリ8GBを搭載する。バス幅は256bitで、合計帯域幅は448GB/sとなる。ボードが必要とする電力が少なくなるため、TBPは約200Wで、リファレンスデザインのクロックは約180Wです。

これは、175WのRTX 2070と比較して5Wの増加であり、TSMCのノードと比較した場合の電力効率の面でSamsungのノードが相当すると推測できます。

NVIDIAのRTX3090およびRTX3080カードのパフォーマンスが直線的にスケーリングしない理由は、これだけの量のコアを処理するように設計されていないゲームエンジンおよびバイナリによるボトルネックが原因であることに注意してください。

大量のグラフィックスパワーを処理するように設計されたvRAYやOctaneなどのソフトウェアでのこれらのカードのベンチマークパフォーマンスにより、ハードウェアとドライバーのスタックは直線的にスケーリングすることがわかっています。

これは、コアをスケールダウンしても、パフォーマンスが直線的にスケールダウンしないことを意味します。

実際、私はRTX 3060TiがRTX2080のクロックよりも優れていることを非常に期待しています。

RTX 2080 Tiよりもわずかに落ちるクロックを想定すると、以前のフラッグシップと簡単に性能を追い抜けるはずです。

RTX 3060 Tiシリーズのカードは非常に長い間開発が進められてきましたが、Videocardzもようやくその確認が取れました。

RTXの完全なラインナップは次のとおりです:

NVIDIA GeForce RTX 30シリーズ「Ampere」グラフィックスカードの仕様

グラフィック
カード名
NVIDIA
GeForce RTX
3060 Ti
NVIDIA
GeForce RTX
3070
NVIDIA
GeForce RTX
3070 Ti?
NVIDIA
GeForce RTX
3080
NVIDIA
GeForce RTX
3090
GPU
アーキテクチャー
チップ型番
Ampere GA104-200 Ampere GA104-300 Ampere GA102-150 Ampere GA102-200 Ampere GA102-300
製造プロセス Samsung 8nm Samsung 8nm Samsung 8nm Samsung 8nm Samsung 8nm
ダイサイズ 395.2mm2 395.2mm2 628.4mm2 628.4mm2 628.4mm2
トランジスタ数 174億 174億 280億 280億 280億
CUDA数 4864 5888 7424 8704 10496
TMU数 /
ROP数
未確認 184 / 96 232 / 80 272 / 96 328 / 112
Tensor /
RT コア数
152 / 38 184 / 46 232 / 58 272 / 68 328 / 82
ベースクロック 1410 MHz 1500 MHz 未確認 1440 MHz 1400 MHz
ブーストクロック 1665 MHz 1730 MHz 未確認 1710 MHz 1700 MHz
FP32 演算性能 16.2 TFLOPS 20 TFLOPs 未確認 30 TFLOPs 36 TFLOPs
RT 演算性能 32.4 TFLOPS 40 TFLOPs 未確認 58 TFLOPs 69 TFLOPs
Tensor-TOPs 未確認 163 TOPs 未確認 238 TOPs 285 TOPs
メモリ容量
・種類
8 GB GDDR6 8 GB GDDR6 10 GB GDDR6X? 10 GB GDDR6X 24 GB GDDR6X
メモリバス幅 256-bit 256-bit 320-bit 320-bit 384-bit
メモリ速度 14 Gbps 14 Gbps 320-bit 19 Gbps 19.5 Gbps
メモリ帯域幅 448 Gbps 448 Gbps 320-bit 760 Gbps 936 Gbps
TDP 180W? 220W 250-280W 320W 350W
小売価格
(FE版・米ドル
$399 US? $499 US $599 US? $699 US $1499 US
発売日 2020/11/17? 2020/10/29 不明 2020/09/17 2020/09/24

AMDは最近10月28日にNavi22シリーズを発売しました。

これが、NVIDIAがTiベースのモデルを最初に発売することを決定した理由の1つである可能性があります。

3080および3090カードはまだ在庫がないため、ゲーマーは明らかに次世代GPUを手に入れたいと切望しています。

ああ、NVIDIAで何が起こっているのか疑問に思っているなら、私はあなたのためにいくつかの美味しい詳細を持っています。

サムスン8nmノードの最初のいくつかのバッチの歩留まりは予想よりも低く、高価です。 同社は、今後数か月で歩留まり(したがってウェーハの価格)が大幅に向上すると予想しています。

株主を保護するために、同社は最初の数バッチの注文に注意を払い、その後のバッチの注文を大幅に増やしました。

この問題は、ボットが最初からボリューム全体を吸い上げることによってさらに悪化しました。

ホリデーシーズンの前に大量注文が発生し始めると予想されます(もちろん、マイニング野郎がそれをすべて飲み込んでいないと仮定します)。

ソース:wccftech – NVIDIA GeForce RTX 3060 Ti Will Be Announced On November 17th

 

解説:

本文中にちょっと無視できない箇所があったので、ネットを漁ってデータを拾ってきました。

その個所と言うのはここです。

NVIDIAのRTX3090およびRTX3080カードのパフォーマンスが直線的にスケーリングしない理由は、これだけの量のコアを処理するように設計されていないゲームエンジンおよびバイナリによるボトルネックが原因であることに注意してください。

大量のグラフィックスパワーを処理するように設計されたvRAYやOctaneなどのソフトウェアでのこれらのカードのベンチマークパフォーマンスにより、ハードウェアとドライバーのスタックは直線的にスケーリングすることがわかっています。

これは、コアをスケールダウンしても、パフォーマンスが直線的にスケールダウンしないことを意味します。

だとしたらnVidiaらしからぬとても間抜けな話です。

最低でも3DMarkには反映されるように努力すべきです。

参考:GPUについて

のベンチマーク一覧にもありますが

1W当たりのスコア

RTX3090 TimeSpy・・・57、FireStrikeExtreme・・・69

RTX3080 TimeSpy・・・56、FireStrikeExtreme・・66

RTX3070 TimeSpy・・・63、FireStrikeExtreme・・78

となっています。今のところ電力当たりの効率はRTX3070が一番優れているという結果になっています。

私は巨大なダイを身の丈に合わないクロックで動かしていたからだと思っていたのですが、どうも違うようです。

ではvRAYの結果を見てみましょう

vRAY BenchMark (Million Per Path)

RTX3080 10GB ・・・638

RTX2080Ti 11GB・・・365

RTX3080:RTX2080Ti=1.75:1

CUDAコア比

RTX3080:RTX2080Ti=2:1

FP32演算能力比

RTX3080:RTX2080Ti=2.21:1

となり、別に綺麗にスケーリングはされていないような気がします。

CGのレンダリングは動画のエンコードと並んでGPUがもっとも得意とする作業の一つです。

この手の作業の場合は、GPUのスケールに綺麗に比例することが多いです。

そのCGのレンダリングにおいてもCUDAコア数比やクロックも考慮に入っている公称FP32演算性能比でちゃんと比率通りになっていないというのはちょっとどうなのかなと思います。

あまり正確なものの見方ではないと感じます。

それとも、ソフト側がうまく生かしきれてないと言うことなのでしょうか。

と言うわけで話は少しRTX3060Tiから横道にそれましたが、AmpereがCUDAコア数やFP32演算性能で比較するとあまり性能が出ない点に関して、少し見てみました。

ソフト側が対応を進めればFP32演算性能比かCUDAコア数比と同じくらいの結果になるのかもしれませんが、少なくとも現時点ではそうではないようです。

 

 

 

 

  • B!