噂：リークしたNVIDIA RTX 3080 Tiの疑惑のスペックシートは、ピーク演算性能23 TFLOPSと言われています

NVIDIA RTX 3080 Tiの疑惑のスペックシートのスクリーンショットがTwitter（@CyberPunkCat）を介して流出しました。

リーク情報は奇妙で、技術的な矛盾があり、検証されていないため、純然たる噂の領域にあると前もってお断りいたします。

すべての噂と同様に-割り引いて考えることを強く推奨します。

検証されていない噂があなたにとって必要ない場合-すぐに読むのを止めてください。

NVIDIA RTX 3080 Tiの噂のスペックシートが流出

始める前に、今後のカードの命名法はまだ確認されていないことを覚えておいてください。

以前のリークでは、RTX 3080、RTX 3090、第2世代のRTX TITAN、TiとSUPERの変種と呼ばれる可能性があることを指摘しています。

言い換えれば、どのチップが何と呼ばれるかもしれないかについては、ほとんど何もわかっていないということだ。

唯一確かに知っているのは、SKU 10、20、30と呼ばれる製品の中で、現在3つのバリエーションがあるということです。

SKU 10はGA102-200 GPU、SKU 20はGA102-300 GPU、SKU30はGA102-400 GPUだ。

https://twitter.com/CyberCatPunk/status/1275331994893684736?ref_src=twsrc%5Etfw

以前の、非常に信頼性の高いリークによると、ラインアップにRTX 3090があるだろう - これは、この特定の噂は反対になります。

メモリの速度もリークされていますが、この噂はそれに反しています。

この噂は、我々が今では無効であると考えられる情報に基づいているようですので、完全に間違っているか、または信頼できるリーカーからのリークのほとんどが間違っていたかのどちらかです。

[意見] 個人的には、彼らが信頼できる情報を提供したきたという実績を考えると、以前のリークの方を信用したいと考えています[意見終わり]。

TwitterユーザーのKARMAA氏は、事前のリークとの矛盾点をまとめた。

https://twitter.com/VOLTECYT/status/1275399116529389568?ref_src=twsrc%5Etfw

翻訳
いくつかの不一致
TDP vs TGP。
CUDAコア vs CUDAコア。
TFLOPSが間違っている。
7nm(おそらくTSMC) vs (Samsung - どのプロセスかは不明、おそらく8nm)
GDDR6 vs GDDR6X。
正直なところ、これは他の想定されるリークとは一致しません。唯一不変なのは「Ampere」という言葉だけです。

これが本当なら [意見]しかし、私は可能性が低いと考えていますが[意見ここまで]、RTX 3090やTITANではなく22 TFLOPSのRTX 3080 Tiを見ていることになります。

これはGA102-400チップと呼ばれているので、これはフラグシップであるSKU30であるとされています。

また、TFLOPsと表示されているブーストクロックの差を考慮して、定格ブーストクロックを導き出すことができます。

定格TFLOPsが21の場合、「公式」のブーストクロックは1953MHzとなる。

これは、前世代の定格ブーストクロックから約100-200MHzの増加であり、それ自体はかなり妥当なものです（他のすべての技術的な矛盾を無視すれば）。

ソース：wccftech - Rumor: Alleged Spec Sheet Of An NVIDIA RTX 3080 Ti Leaked, Shows Up To 23 TFLOPs Of Peak Graphics Horsepower

解説：

可能性は0ではない・・・が

今までRTX3090と称されていたAmpereのトップモデルがRTX3080Tiであり、21TFLOPS台のFP32演算性能があるという情報がリークしました。

私の見解ではこれは、間違いだと思います。

さすがのwccftechもかなり懐疑的な姿勢で報じており、私もほぼ同じ意見です。

公式発表された6912CUDAコアのGA100が19.5TFLOPSであり、5342CUDAコアのRTX3080Ti(?)が21TFLOPS台と言うのは眉唾としか言いようがありません。

伝統的にTeslaはGeforceよりFP32の演算性能が若干低めですが、それでもGA100のCUDAコア数は6912であり、5342CUDAコアのGA102と比較すると約30%多くなっています。

※　余談ですが、GA100はダイのサイズが826mm2でそこから30%小さいと578mm2と7nmでなんとかコスト的に行けるのかなと言う程度のサイズになるので、この点からも理にかなっていると思います。

TeslaとGeforceが両方存在したPascalアーキテクチャーを前提に考えると、このCUDAコア数の差をひっくり返すのは難しいといわざるを得ないです。

良くて同程度か、下手をすると17TFLOPS台の可能性もあるのかなと思います。

また、nVidiaがレイトレーシングとDLSSの普及に力を入れていることを考慮に入れると、通常の演算性能にはあまり力を入れてないという可能性が非常に高いです。

理由はGA100の公式発表の記事でも書きましたが、DLSSが4K60FPSをターゲットにした技術であるため、その前後で多少通常のFPSを改善しても、あまり意味がない可能性が高いからです。

例えばDLSSあり、4K60FPS、DLSS無し40FPSをDLSS無し75FPSにするよりも、4KでDLSSあり、レイトレーシング全開で60FPSにした方が意味があるからです。

レイトレーシングはnVidiaが力を入れて普及を図っているものであり、DLSSはそれを補助する技術です。

恐らくは当面、nVidiaが目指すのはレイトレーシングを全力で使って4K60FPSを実現することであり、それ以外にはあまり力を入れていないのではないかと思います。

レイトレーシングの良いところは

・ゲーム画像の表現力が上がる

・開発の生産性が上がる

の二点と言われています。

Ampere世代で、ミドルレンジ(RTX3060)でFullHDくらいまでのレイトレーシングを常識にしたいと思っているのでは？と思います。

若しくは別途アドインカード(PhsyXのような)を発売するかですね。(ただし、レイトレーシングは高速なメモリアクセスが必要と言われていますので、PCI Express越しのアクセスでは難しいのかなと思います。)

もちろんこれは純然たる私の意見ですから、違っている可能性もあります。

しかし、先日の3DMarkのスコアのリークを考えると、その可能性が高いのかなと思います。

7nmのGPUチップは小型の溶鉱炉のようなもの

ついでなので、もう1点触れておきましょう

7nmの先駆製品である、AMDのRX5000シリーズを見ると、ブーストクロック・ゲームクロック・ベースクロックと別れていますが、これは7nmの密度が上がり排熱が厳しくなったことが原因だと思います。

熱と言うのはどうにもならないため、Ampere世代のGeforceもこの熱に苦しむ可能性は大きいと思います。

※　仕事量(演算性能)に対する結果としての熱と言うのは仮にAmpereの方が優れた設計だったとしてもせいぜい10%程度で、行っても20%は変わらないでしょう。それは、TuringよりもNaviのほうがTDPに対するベンチマーク性能が上であることからも見て取れます。

nVidiaのPCI Express版GA100もTDP250Wに制限され、ピーク性能が短い間だけしか出せないといわれています。

今回、単体ヒートシンクが$150と言う話も出ていますので、ポイントは排熱になると思って間違いないでしょう。

恐らく、ピーク性能を思いっきりPRしてくると思いますが、シビアに最高性能を要求される(4Kゲーミングのような)ゲームにおいて、そのビーク性能を維持することは難しいといわざるを得ないです。

それは、AMDのRX5000シリーズがブーストクロック・ゲームクロック・ベースクロックと言う表記を使い始めたことからも伺い知ることが出来ます。

補足　GA102と選別品

コメントでFF1さんからクロックに関する指摘がありましたので、それにインスパイアされて考察の補足を加えます。

とても良い指摘だと思います。この場で御礼申し上げます。ありがとうございました。

TU102には400Aと400と言う2つの種類のチップが存在しました。

それは同じRTX2080Tiと言う名前で売られましたが、OC耐性がかなり違い、それは値段にも反映されていました。

しかし、この売り方は非常にもったいないと思います。

公式の性能にもTU102-400の方を前提に書かなくてはならないため、本来持つ性能を前提にできなかったという面はあったと思います。

しかし、今回GA102はRTX3090(RTX3080Ti)とRTX3080の2つがあるといわれています。

私はこの理由を考えてみましたが、RTX3090(RTX3080Ti)がGA102の選別品、RTX3080が選別落ち品と言う区分けだと思います。

こうすれば、ハイクロックまで回る高性能チップをRTX3090(RTX3080Ti)に回すことが出来、スペック表の数値を上げることが出来、マーケティング上も有利です。

また、同じ名前の製品で二種類の性能が全く違うチップがあるという状態も避けることが出来ます。

GA102-400A(?)がRTX3090(RTX3080Ti)、RTX3080がGA102-400のような感じで、性能の違うチップを違う製品名で販売することが出来、マーケティング上も有利です。(もちろんですが、有効になっているCUDAコア数も違います。念のため)

TU102の時は性能の違う二種類のチップを同じ製品名で販売していたため、性能の低い方のチップに公式のスペックを合わせていたのではないかと思いますが、今回に関しては、高性能チップはすべてRTX3090(RTX3080Ti)に回すことが出来ますので、(表記上の)ブーストクロックの数値は今までよりも上げることが出来るかもしれません。

このため、熱の問題をクリアできれば、最高1.4GHz程度のブーストクロックであるGA100以上の演算性能を出すことも可能かもしれません。

結局は続報を待つしかありませんが、この点、コメントの指摘によってインスパイアされたので特に補足しておきます。

まあ、まだあきらめるのは早いという感じでしょうか(笑

[st_af id="7964"]

FF1 より:
2020年6月24日 2:07 AM
5248コアを2ghzで回せばFP32演算性能は21Tflopsに到達するので、全然現実的な話だと思いますけどね。
ワッパを無視すれば、クロックが2ghzを下回ることは流石にないと思います。
- mrk41110 より:
  2020年6月24日 2:39 AM
  今回は、排熱が出来ればね、と言う話ですね。(笑
  GA102は多分600mm2前後だと思いますが、それを2GHz前後で回すのはちょっと難しいのでは?というのが私の予測ですね。
  GTX1080Tiのブーストクロックは1582MHz、RTX2080TiFE版のブーストクロック(最低保証)は1635MHzでしたが、排熱とのバランスで2GHz迄回せるかどうかと言う話になりますね。
  ※　ただしもちろん、RTX2080Tiの実質のブーストクロックは回せるところまで回しているのは理解しています。私も持っていますので。うちの奴は1.9GHzまでは回ります。
  RX5700XTは250mm2前後で2GHzは出せませんでしたが、Ampereはどうなるのか続報が出てみないと判断はできませんね。
  ただし、PS5のiGPUは2GHz迄回るといわれていますので、なんとも言えないところではあります。
  まあ、アーキテクチャーも全然違うので本当に予測でしかありません。
  あくまでもFE版の公式アナウンスされる性能であることはお断りさせていただきます。