NVIDIA RTX 3080 TiとGA102の "Ampere "仕様、他の重要な断片が明らかにされた

PCハードウェアに焦点を当てたYouTubeチャンネル「Moore's Law is Dead」が、NVIDIA内部の情報源とのやり取りを引用して、NVIDIAの次世代 "Ampere "ベースのフラッグシップコンシューマグラフィックスカード「GeForce RTX 3080 Ti」の美味しいな技術仕様を公開した。

このレポートでは、NVIDIAのFounders Edition(リファレンス)ボードのデザインに大きな変更があったことや、シリコンに何があるかが語られています。

まず、RTX 3080 Tiリファレンスデザインカードは、RTX 20シリーズとは異なり、トリプルファン冷却ソリューションを採用しています。

このクーラーは、RTX 2080 Ti FE冷却ソリューションよりも静かだと言われています。このカードは、一対の8ピンPCIe電源コネクタから電源を供給する。

ディスプレイ出力はDPが3つ、HDMIとVirtualLink USB-Cが各1つ。ソースは、「Ampere」がPCI-Express gen 4.0 x16ホストインターフェースを実装することを確認しています。

「Ampere」でNVIDIAは3層のハイエンドGPUを開発しており、「GA102」が先頭に立って「TU102」を継承し、「GA104」が上位性能セグメントを保持し、現在の「TU104」を継承しているが、その間の新しいシリコン、コードネームは「GA103」で、現世代からの先行者はいないという。

「GA102」は、5,376個の「Ampere」CUDAコアを搭載すると報じられている(「Turing」よりも最大10%高いIPC)。

このシリコンは、噂されている7nmクラスのシリコン製造ノードを利用して、"GA102 "でも2.20GHz以上のGPUクロックを実現しています。

報告書によると、シリーズの中のより小さなチップでは、2.50GHzを超えるブーストが可能だという。

「GA102」がRTX 3080 Tiのためにわずかにカットダウンされていても、このシリコンは最終的に21TFLOPsを超えるFP32計算性能を発揮する可能性があります。

このカードは、より高速な18Gbps GDDR6メモリを使用しており、メモリ帯域幅は863GB/sとRTX 2080 Tiよりも40％も高い（メモリバス幅が384ビットになる場合）。以下は、NVIDIAのスライドではなく、ムーアの法則は死んでいるビデオプレゼンテーションからのスクリーングラブです。

※　クリックすると別Window・タブで開きます

性能に関しては、「GA102」ベースのプロトタイプは、最適化されていないゲームでは4K UHD解像度でRTX 2080 Tiより40パーセント高い性能を発揮し、最適化されたゲームでは50パーセント高い性能を発揮し、「ベストケースシナリオ」（「Ampere」アーキテクチャに最適化されたゲーム）では最大70パーセントの性能を発揮すると言われています。

ストリーミングマルチプロセッサの数を増やすことで、NVIDIAはTuringと比較してCUDAコア：RTコアの比率を2倍にしており、その結果、1層あたりのRTコア数が増え、レイトレーシングの性能が向上していることが、以前のリークから分かっています。

各 "Ampere" RTコアは、"Turing "に比べて単位クロック速度あたり4倍以上の交点を処理できるという。

Tensorコアの数も増加すると報告されています。レイトレーシングとAIの性能向上に焦点を当てることで、ゲーム開発者はタイトルごとにより多くのRTX効果を詰め込むことができ、ユーザーは古い "Turing "カードで望むものを無効にすることができるようになります。

「Turing」の性能制限により、開発者は、RTX機能セットの中から何を実装するかを選択することになりました。

「Ampere」では、NVIDIAは、画質と性能を向上させたDLSS 3.0を導入することができました。NVIDIAは、ビデオメモリ、システムメモリ、フラッシュベースのストレージにビデオメモリを分散させるNVCacheと呼ばれるAMDのHBCCに似たハイブリッドメモリ技術を復活させることができる。

※　クリックすると別Window・タブで開きます

最後に、NVIDIAがどのようなシリコン製造プロセスを使うことができるのか、より明確になった。

どうやらNVIDIAは、製品スタックを2種類の7nmクラスのノードの間に分散させることになるようだ。

「GA102」や「GA103」のようなハイエンドASICは、TSMC N7+のような7 nm EUVノード上に構築される可能性があり、一方、小型ASICは、N7PやN7のような従来のDUVベースの7 nmクラスノード上に構築される可能性がある。

まだ財布を出してはいけない。発売スケジュールでは、2020年5月(GTC)には、Tesla A100やDGX A100システムのような「Ampere」をベースにしたHPCパーツに焦点を当てていると指摘している。

2020年9月には、NVIDIAは「Cyberpunk 2077」のリリースに非常に近い日程で、次世代GeForceの発売に特化したイベントを別途開催する予定だ。

ソース：techpowerup - NVIDIA RTX 3080 Ti and GA102 "Ampere" Specs, Other Juicy Bits Revealed

解説：

PC系のYoutubeチャンネル「Moore's Law is Dead」でRTX3080Tiの断片的な情報が公開されたようです。

一応今までの情報と内容はほとんど同じですが、

リファレンスモデルのファンはトリプルファンになる
PCI-Express gen 4.0 x16になる
「GA102」は、5,376個の「Ampere」CUDAコアを搭載する
IPCが10%アップ
クロックは「GA102」でも2.2GHzと2GHz越え
ハイエンドチップとして「GA102」のほか「GA103」も用意されているが、全く新しいグレードになる。
「GA102」のFP32の演算性能は21TFLOPS
Ampere RTコアは数が倍増、クロック当たりTuringの4倍の交点を処理できる
DLSS3.0に対応
上位チップは7nmEUV、下位チップは7nmで製造される
メモリは18Gbpsでバス幅384bitだった場合のメモリ帯域幅は863GB/s
「GA102」は最適化されていないゲームでRTX2080Tiの1.4倍、最適化されているゲームで1.5倍、特にAmpereに最適化されているゲームでは1.7倍の性能を発揮

というような内容になっているようです。

メモリバス幅が384bitだった場合、12GB、863GB/sですが、従来までのX080Tiと同じ352bitだった場合は11GB、791GB/sとなります。

ソースはnvidiaの中の人らしいですね。

一介のYoutubeチャンネルなのでどこまで信用できるのかどうかわかりませんが、公開されている内容を見ると、かなり信用できるような感じです。

何より仕様に無茶なところがなく、かなり現実的な内容に見えます。

GDDR6の18Gbpsを使うというのもTuringのSuperモデルで高速なGDDR6メモリを使ったことを彷彿とさせる感じです。

一応、大本のソースであるYoutubeの動画を張っておきます。

[st_af id="7964"]