PCハードウェアに焦点を当てたYouTubeチャンネル「Moore's Law is Dead」が、NVIDIA内部の情報源とのやり取りを引用して、NVIDIAの次世代 "Ampere "ベースのフラッグシップコンシューマグラフィックスカード「GeForce RTX 3080 Ti」の美味しいな技術仕様を公開した。
このレポートでは、NVIDIAのFounders Edition(リファレンス)ボードのデザインに大きな変更があったことや、シリコンに何があるかが語られています。
まず、RTX 3080 Tiリファレンスデザインカードは、RTX 20シリーズとは異なり、トリプルファン冷却ソリューションを採用しています。
このクーラーは、RTX 2080 Ti FE冷却ソリューションよりも静かだと言われています。このカードは、一対の8ピンPCIe電源コネクタから電源を供給する。
ディスプレイ出力はDPが3つ、HDMIとVirtualLink USB-Cが各1つ。ソースは、「Ampere」がPCI-Express gen 4.0 x16ホストインターフェースを実装することを確認しています。
「Ampere」でNVIDIAは3層のハイエンドGPUを開発しており、「GA102」が先頭に立って「TU102」を継承し、「GA104」が上位性能セグメントを保持し、現在の「TU104」を継承しているが、その間の新しいシリコン、コードネームは「GA103」で、現世代からの先行者はいないという。
「GA102」は、5,376個の「Ampere」CUDAコアを搭載すると報じられている(「Turing」よりも最大10%高いIPC)。
このシリコンは、噂されている7nmクラスのシリコン製造ノードを利用して、"GA102 "でも2.20GHz以上のGPUクロックを実現しています。
報告書によると、シリーズの中のより小さなチップでは、2.50GHzを超えるブーストが可能だという。
「GA102」がRTX 3080 Tiのためにわずかにカットダウンされていても、このシリコンは最終的に21TFLOPsを超えるFP32計算性能を発揮する可能性があります。
このカードは、より高速な18Gbps GDDR6メモリを使用しており、メモリ帯域幅は863GB/sとRTX 2080 Tiよりも40%も高い(メモリバス幅が384ビットになる場合)。以下は、NVIDIAのスライドではなく、ムーアの法則は死んでいるビデオプレゼンテーションからのスクリーングラブです。
※ クリックすると別Window・タブで開きます
性能に関しては、「GA102」ベースのプロトタイプは、最適化されていないゲームでは4K UHD解像度でRTX 2080 Tiより40パーセント高い性能を発揮し、最適化されたゲームでは50パーセント高い性能を発揮し、「ベストケースシナリオ」(「Ampere」アーキテクチャに最適化されたゲーム)では最大70パーセントの性能を発揮すると言われています。
ストリーミングマルチプロセッサの数を増やすことで、NVIDIAはTuringと比較してCUDAコア:RTコアの比率を2倍にしており、その結果、1層あたりのRTコア数が増え、レイトレーシングの性能が向上していることが、以前のリークから分かっています。
各 "Ampere" RTコアは、"Turing "に比べて単位クロック速度あたり4倍以上の交点を処理できるという。
Tensorコアの数も増加すると報告されています。レイトレーシングとAIの性能向上に焦点を当てることで、ゲーム開発者はタイトルごとにより多くのRTX効果を詰め込むことができ、ユーザーは古い "Turing "カードで望むものを無効にすることができるようになります。
「Turing」の性能制限により、開発者は、RTX機能セットの中から何を実装するかを選択することになりました。
「Ampere」では、NVIDIAは、画質と性能を向上させたDLSS 3.0を導入することができました。NVIDIAは、ビデオメモリ、システムメモリ、フラッシュベースのストレージにビデオメモリを分散させるNVCacheと呼ばれるAMDのHBCCに似たハイブリッドメモリ技術を復活させることができる。
※ クリックすると別Window・タブで開きます
最後に、NVIDIAがどのようなシリコン製造プロセスを使うことができるのか、より明確になった。
どうやらNVIDIAは、製品スタックを2種類の7nmクラスのノードの間に分散させることになるようだ。
「GA102」や「GA103」のようなハイエンドASICは、TSMC N7+のような7 nm EUVノード上に構築される可能性があり、一方、小型ASICは、N7PやN7のような従来のDUVベースの7 nmクラスノード上に構築される可能性がある。
まだ財布を出してはいけない。発売スケジュールでは、2020年5月(GTC)には、Tesla A100やDGX A100システムのような「Ampere」をベースにしたHPCパーツに焦点を当てていると指摘している。
2020年9月には、NVIDIAは「Cyberpunk 2077」のリリースに非常に近い日程で、次世代GeForceの発売に特化したイベントを別途開催する予定だ。
ソース:techpowerup - NVIDIA RTX 3080 Ti and GA102 "Ampere" Specs, Other Juicy Bits Revealed
解説:
PC系のYoutubeチャンネル「Moore's Law is Dead」でRTX3080Tiの断片的な情報が公開されたようです。
一応今までの情報と内容はほとんど同じですが、
- リファレンスモデルのファンはトリプルファンになる
- PCI-Express gen 4.0 x16になる
- 「GA102」は、5,376個の「Ampere」CUDAコアを搭載する
- IPCが10%アップ
- クロックは「GA102」でも2.2GHzと2GHz越え
- ハイエンドチップとして「GA102」のほか「GA103」も用意されているが、全く新しいグレードになる。
- 「GA102」のFP32の演算性能は21TFLOPS
- Ampere RTコアは数が倍増、クロック当たりTuringの4倍の交点を処理できる
- DLSS3.0に対応
- 上位チップは7nmEUV、下位チップは7nmで製造される
- メモリは18Gbpsでバス幅384bitだった場合のメモリ帯域幅は863GB/s
- 「GA102」は最適化されていないゲームでRTX2080Tiの1.4倍、最適化されているゲームで1.5倍、特にAmpereに最適化されているゲームでは1.7倍の性能を発揮
というような内容になっているようです。
メモリバス幅が384bitだった場合、12GB、863GB/sですが、従来までのX080Tiと同じ352bitだった場合は11GB、791GB/sとなります。
ソースはnvidiaの中の人らしいですね。
一介のYoutubeチャンネルなのでどこまで信用できるのかどうかわかりませんが、公開されている内容を見ると、かなり信用できるような感じです。
何より仕様に無茶なところがなく、かなり現実的な内容に見えます。
GDDR6の18Gbpsを使うというのもTuringのSuperモデルで高速なGDDR6メモリを使ったことを彷彿とさせる感じです。
一応、大本のソースであるYoutubeの動画を張っておきます。
nVidia RTX4000SUPER
nVidia RTX4000
nVidia RTX3000シリーズGPU
RTX3060 12GB GDDR6
RTX3050 6GB