GPU情報

TU102のスペック情報がリーク他

更新日:

DLSSのことについて調べている間にTU102の情報がリークしていたのですが、見逃していました。

まず前提として、一般の人向けに公開されている情報は、当サイトの記事「GPUについて」に書いてあることが全てです。

参考記事:GPUについて

一応ここにも表を張っておきます。

 

一般の人向けに対してはnVidiaの公式HPにある上の表のスペックがすべてとなります。

Tensorコアの数などは公式には公開されていません。

今日の話はnVidiaがGamesconで公開した資料に基づいたものです。

TU102 RTX2080Ti (一部予測値)
SM 72 68
CUDAコア数 4608 4352(確定)
Tensorコア数 576 544
RTコア数 72 68
GEOMETRY UNIT 36 34
Texture Unit 288 272
ROP Unit 96 88
Memory 384bit/7GHz/GDDR6 352bit/-/GDDR6
NV Linkチャンネル数 2 2

上の様になっています。

TU102を使うRTX 2080 Tiは実際には恐らくは歩留まり向上のためにいくつかのユニット/ブロックが無効化されていますので上のフルスペックのTU102とは数が違います。

計算上、おそらく上の表で間違いありませんが、CUDAコアの数以外は公式発表されている物ではなく、私が計算したものなのでご了承ください。

RTコア数について公式で発表したのは恐らくこれが初めてなんじゃないかと思います。

nVidiaは9月14日に詳細な資料を発表するとしています。

これらの情報を含むかどうかまでは分かりません。

当サイトでは一応悪あがきしていますが(笑、一般の方はスペックを確定するのはそれまで待った方がよいでしょう。

 

もう一つのリークは、TuringはPascalより1.5倍のシェーディング性能を持つということです。

※シェーディングとは、光の角度と光源からの距離を考慮して色を変化させ、実写のような効果を得る処理を指します。レンダリング処理の一部です。もちろんゲームでは広く普通に使われています。

あくまでも相対性能ということです。

この話が本当なら、3DMarkなどのベンチマークでは1.5倍の値が出るとのこと。

つまりRTX2080はGTX1080の基本1.5倍の性能というのはここから出ているようです。

ここから4KやHDRでDLSSに対応しているかいないかでFPSに差が付き、RTXに対応している場合、表現で差が付くというようになるようです。

※ 追記 シェーダーとRTXの関係

RTXがあればシェーダーはいらないのでは?と素人考えで思いましたが、どうもそうではないようです。

RTXが行っているレイトレーシングはほんの一部で、複雑なものは処理していないということ。

レイトレーシングで処理していない部分は従来の方法で処理しているので、このシェーダーの強化もRTX対応ゲームにおいて十分に全体の処理の高速化に恩恵があると思います。

これらの処理方法は実は従来のゲームとほとんど変わらないものであるということです。

これらを全部レイトレーシングで処理しようとすると商用映像の作成に使用する高額なハードウェアが必要になるということです。

これらの見解はRedshiftというプロ向けのレンダラーを出している会社の方が書いたものを参考にしてまとめてみました。

下に全文がありますので、3D CGに関する知識がある方はより深く理解できるものと思います。

結論は現状の技術ではゲームのリアルタイムレンダリングにはRTXと従来のシェーダー、両方必要であるということです。

従来の方式と何が違うのかと言えば、RTXを使用することによってゲーム映像の表現力が高くなるという認識で間違いは無いようです。

この解釈に対して間違いや誤解がある部分があったら指摘していただけると幸いです。

ソース:ボーンデジタル - 最近のリアルタイムレイトレーシングのデモに関するいくつかの考察

 

3DMark TimeSpy

3DMark TimeSpyがレイトレーシングに対応したバージョンを9月30日に公開するようです。

9月30日とするのはWindows10の大規模アップデートも考慮に入れてということのようですね。

やはりUL社は3DMarkの新バージョンを公開してきました。

これでますますRadeonとの差がついてしまいますが、AMDがレイトレーシング(DXR)についてどのようにするのか気になるところです。

RTコアの詳細が公開されていませんので、既存の何かで処理が代替できるものなのかどうかわかりませんが、AMDがレイトレーシングに対応しない場合、少なくともベンチマークレベルでスコアが出なかったり極端にスコアが落ちたりなどはっきり差がついてしまうことになります。

 

Turingはキャッシュも改良されている。

L1キャッシュの帯域幅:Pascal比2倍

L1キャッシュのレイテンシと容量:Pascal比2.7倍ということです。

L2キャッシュの容量:Pascal比2倍

ということになっています。L1/L2に関してはユニットごとの共有の仕方にも変化があるので、純粋に容量が増えていると言えないところがあると思うのですが、レイテンシが小さくなっているのは確実に性能の向上をもたらすでしょう。

実際どうなっているかは文字で説明するのが難しいのでソース元の画像を見ていただくのが一番早いと思います。

ソース:Videocardz - NVIDIA Turing gets a bigger L2 cache

 

全体のソース

Videocardz - Exclusive: NVIDIA GeForce RTX 2080 (Ti) Editors’ Day leaks

wccftech - NVIDIA’s Flagship Turing TU102 GPU For GeForce RTX 2080 Ti Detailed – 50% Faster Per Core Performance, 288 TMUs/96 ROPs on Full Die and New Overclocking Features

techpowerup.com - 3D Mark's Time Spy With Raytracing to be Launched by the End of September

 

※ 続報が出ましたので、この記事を読まれた方はタグ「geforce」の最新の投稿を必ず確認するようにしてください。

-GPU情報
-

Copyright© 自作ユーザーが解説するゲーミングPCガイド , 2018 All Rights Reserved.