NVIDIAのRTX 3000シリーズ「Ampere」フラッグシップは627mm²の大型ダイを搭載する？

投稿日：2020年7月9日

ある有名なリーカーが、次期NVIDIA Ampereダイは627mm²の大きさになるとコメントしています。

このソースは信頼できるものですが、彼らは、現時点では100%噂なので、割り引いて考えて、額面通りに受け取らず、確信が持てないという注釈を付けています。

NVIDIAがゲーム用AmpereのラインナップをSamsungの8nmノードに移動し、627mm²がレチクルの上限に達しているため、これが事実であるとしても驚くに値しません。（それは確かに高くなるでしょうが、この時点で歩留まりは大幅に低下します）。

NVIDIAのゲーミング向け大型Ampere GPUが627mm²の大きなダイになる？

このツイートが事実であることが判明したとしても、これがSKU10のことを指しているのか、20のことを指しているのか、30のことを指しているのかは現時点ではわからないことを覚えておいてください。

RTX 2080 Tiは754mm²だったが、16nmプロセス(12NFFは基本的に最適化された16nm FF)をベースにしていた。

サムスンの8nmプロセス（これは基本的に10nmに最適化されています）に移行すると、パフォーマンスを一定に保ちながら、消費電力をわずかに増加させるために、少なくとも30％以上の密度を高くすることが出来ます。

これは、12NFFプロセスで製造された895mm²のGPUに相当します。

627mm2
— KatCorgi (@KkatCorgi) July 8, 2020

このチップの予想されるパワーレベルに基づいて、我々はこれがゲーミング用のビッグ Ampere GPUであると予想しています。

これはRTX 3090かRTX 3080 / Tiモデルかもしれない。

1 つ確かなことは, NVIDIAはこのラインナップのいくつかの非常に強力なGPUを展開することを計画しており、これがどのSKUであるかにかかわらず、大幅なパフォーマンスの向上を得られるでしょう。（うまくいけば、コストパフォーマンスも高くなります）。

TSMCからSamsungへのシフトも、

1) Samsungにはプロセスを安く提供できるだけの十分な資金があり、

2) NVIDIAの要求を満たすだけの十分な量があることを考える

と、ここでは論理的な動きかもしれない。

Samsungの8nmプロセスは、10nmのバックボーンをベースにしており、10nmよりも10%以上エネルギー効率が高い。

8nmは、NVIDIAの12NFF（これは基本的には16nmの最適化版に過ぎない）からの大幅な性能のジャンプであり、同社は、より多くの演算能力を供給することで、低いエネルギー効率を非常に簡単に補うことができます（これは、以前に見たRTX 3090の高いTGP定格を説明するものかもしれません）。

ところで、Igorはまた、サムスンへの生産を移すことを確認しました。

我々は当初、NVIDIAが（RTX 3090のような）高性能な部品はTSMCの7nmプロセスに、低価格な部品はSamsungに、というように、段階的に発売するのではないかと聞いていたが、Kopite氏によると、すべての製品とゲームセグメントはSamsungの8nmプロセスをベースにする予定であり、100%の確信を持っているとのことだ。

つまり、RTX 3090、RTX 3080、3070などのSKUは全て8nmプロセスを採用することになる。

プロセスはTSMCよりも効率的ではないので、NVIDIAは、我々がリークされたベンチマークで見てきた大規模なパフォーマンスの飛躍を与えるために、ボード全体でTGPを増加させる必要があります(無論それは目を見張るものです)。

このソースは、NVIDIAの将来のTegraプロセッサは、同様に同じプロセスに基づいていると以前にも述べています。

NVIDIAは、AMDがそのCPUとGPUで7nmの空き容量をすべて予約したときに、初めてTSMCに依存していることを感じた。

結局のところ、RTX 3000シリーズがTSMCの7nmプロセス上にあるか、Samsungの8nmプロセス上にあるかは本当に重要ではありません。

ソース：wccftech - NVIDIA’s RTX 3000 Series ‘Ampere’ Flagship Will Have 627mm² Large Die?

解説：

Ampereのあるモデルのダイサイズは627mm2?

これはおそらくGA102のダイサイズではないかとwccftechでは予想しています。

私がざっくりと計算したGA102のダイサイズは以下のようになります。

GA102の予想されるダイサイズ
GA100=826mm2(TSMC)、6912CUDAコア
GA102=824.71mm2、Samsung8nm、5376CUDAコア
トランジスタ密度
TSMC7nm=95.08MTr/mm2
Samsung8nm=61.58MTrmm2
※　wikichipより
GA102をSamsungの8nmで製造すると約824.71mm2となります。
※　CUDAコア数とトランジスタ密度から割り出したものです。ただしGA100とGA102がアーキテクチャー的にほとんど変わらないものと仮定し、CUDAコア数とトランジスタ数が正比例していると仮定した、かなりざっくりした計算であることはお断りさせていただきます。参考程度と言うことにしてください。

ただしこれはレティクルのサイズなどは全く考慮していませんので、リーカーのリーク情報の方が正しいのではないかと思います。

Samsung8nmで627mm2ってかなり小さいなと思います。

12nmで製造すると895mm2相当と言うことですから、TU102より一回り大きいだけと言うことになりますね。

ちなみにSamsung8nmをトランジスタ密度でTSMC7nmに合わせるとすると627mm2は約406mm2となります。

個人的にはGA100の826mm2と比較としてこれでは小さすぎるので、GA103かGA104じゃないのと思いますが、有名なリーカーさんがGA102と言うならその可能性の方が高いのでしょう。かなりがっかりです。

このダイサイズでCUDAコア数を上げつつ、TensorコアやRTコアの処理能力を2倍以上に引き上げることが可能なのかといぶかしく思います。

また627mm2でも歩留まりはあまり高くならないというような表現がありますので、コスト的にもどうなのかなと思います。

元々Samsungの8nmになったのはAMDが7nmを全部予約してしまったからと言う理由ですが、下手を打ったのかないう感じです。

RDNA2はゲーム機にも使われるアーキテクチャーですから、Vegaのようにゲーム性能が低いと言うこともなく、消費電力当たりの性能でAMDに負ける可能性も出てきたのかなと思います。

Samsung8nmのレティクル上限サイズが627mm2付近と言うのはかなりがっかりポイントです。

Big Naviが505mm2と言われていますので、Samsung8nmとトランジスタ密度で合わせると779mm2となり、GA102(?)よりさらに一回り大きくなります。

はっきり言って627mm2ではショボすぎるので、これで勝負になるのかどうかですねえ。

私としては間違いであってほしいところです。

Samsung8nmとTSMCの7nmを比べると、プロセスの数字だけを見るとそれほど変わらないように見えますが、10nmの改良に過ぎない8nmとはトランジスタ密度で1.54倍もの差があります。

果たしてこれでRDNA2に対抗できるものなのかどうかですね。

nVidiaのケチっぷりがゲーム用Ampereの性能に影響を与えるのか？

AmpereがTSMCの最先端プロセスから弾きだされたのは、SamsungとTSMCの間をフラフラと渡り歩いたからだと私は考えています。

一時期、nVidiaはSamsungのFabで生産するという噂が流れていましたが、過去にもこういう値下げ交渉ともとれるような行動を繰り返しています。

コストの削減は確かに大事ですけど、TSMCはもはや代替の効かない半導体Fabであり、あまりにガメツすぎると結局損をするという典型のような話ですねえ。

nVidia的にはTSMCは単なる下請けみたいなイメージなのかもしれません。

おかしな浮気をせずにTSMCに一直線だったAMDとの差がモロに出た形になります。

GeforceはGPUではかなりビッグネームですから、TSMCの最先端プロセスを使えないというのはかなり大きなマイナスです。

私はかなり落胆しました。

[st_af id="7964"]

-GPU情報

MOLA より:
2020年7月9日 8:32 AM
現状Turingも後発で7nmのRDNA
に対して12nmでも善戦しているので
プロセスの差で勝負が決まるかどうかは
実際出てみないと分からないですね
- mrk41110 より:
  2020年7月9日 8:48 AM
  RadeonとGeforceでは性能におよそ製造プロセス一世代分くらいの差があるので、Samsung 8nmだとAmpereの方が優れている可能性が高いとは私も思いますよ。
  しかし、はっきり言えることは8nmで作られたAmpereよりも7nmで作られたAmpereの方が優秀であることです。(笑
  2年間待った結果がこれと言うのが最大のがっかりポイントですね。
ty225 より:
2020年7月9日 10:40 PM
GA100からGA102をTSMCの7nm→Samsungの8nmへ換算した結果が｢8nmなら824mm2｣ですけど
FP64対応などの所謂｢ゲーミング贅肉｣を削いだら、200mm2程度はダイサイズを縮小出来るとは思いますよ。
確かFP64は、省くだけでも2割程度はダイサイズを縮小出来たはずですし。
あと、トラバーサル・コプロセッサの話が真実なら、レイトレ関係の固定機能も外付けできる事になりますし
GA102がSamsungの8nmで627mm2、は｢絶対無理で小さすぎる｣ってわけでは無さそうな。
- mrk41110 より:
  2020年7月10日 2:39 AM
  まずはご指摘ありがとうございます。
  Turingに相当のモデルがなかった、若しくは自分では見つけられなかったので、規模が違うだけで同一のものとして無理やり計算しました。
  トラバーサルコプロの話は頭にありましたが、はっきりしなかったので、今回は計算に入れませんでした。
  Pascal GP102 471mm2 25.1MTr/mm2
  Turing TU102 754mm2 24.7MTr/mm2
  TuringからPascalの変化を考えると754mm2に対して895mm2と言うのはちょっと小さすぎるかなと言うのが正直な感想です。
  トラバーサルコプロは外付けになるのかもしれませんね。
  その場合、コストはやっぱり期待できないのかなと言う感じですね。
  2チップ構成だと、熱もかなり厳しそうです。
  トラバーサルコプロが別だった場合、ありモデルと無しモデルで分けると、レイトレの普及が遅れることになります。
  ただし、トラバーサルコプロ自体にスケーラビリティが担保されている場合、RTXアクセラレーターカードを追加すればするだけレイトレの性能が上がっていくとすれば納得できる構成になりますね。
  例えばトラバーサルコプロ内蔵のモデルでも別途RTXアクセラレーターカードを追加すればその分だけレイトレの能力がアップするという感じですね。
  そう言う可能性もあるのかなと私は思っています。
  Pascal世代以前のGeforceにも組み合わせ可能であればなおよいのではないかと思います。(笑
  この場合、ThreadripperやCore-Xにかなりのアドバンテージがあることになります。
  折角HEDTと言う高性能プラットフォームがあるのでぜひそうなってくれると嬉しいですね。

: ASUSがATS RX 9070 GRE Editionを発表、3072シェーダー、12GB GDDR6 VRAM、2880MHzのブーストクロックを搭載
ASUSが「ATS RX 9070 GRE OC edition」を発表し、初のRadeon RX 9070 GREが数日後に発売される。 ASUSが公式サイトでATS RX 9070 GRE O12 ...

: NVIDIA、GeForce RTX 4080 12GBをキャンセル、RTX 4080 16GBは11月16日の発売に向けて調整中
NVIDIAは、GeForce RTX 4080 12GBグラフィックスカードの発売を中止する一方、16GBのバリエーションは11月の発売を予定していることを公式に確認しました。 NVI ...

: AMD、2022年第4四半期にRadeon RX 7900 XTX & RX 7900 XT用GPU「RDNA 3 "Navi 31"」を20万台出荷すると報告される
AMDは、Radeon RX 7900 XTX & RX 7900 XTグラフィックスカード用のRDNA 3「Navi 31」GPUを2022年第4四半期に20万個出荷すると報じられている。 ...

: ASRock が Radeon RX 7800XT 16GB および Radeon RX 7700XT 12GB グラフィックスカードを EEC に提出
ASRock が Radeon RX 7800 XT および RX 7700 XT メモリ構成を確認 ASRock は、ユーラシア経済委員会の規制当局に次期 Radeon RX 7000 シリーズに関 ...

: NVIDIAとAMDのGPU価格は2022年に入ってから57％下落、6月以降だけで14％の中古GPU価格下落を記録
数ヶ月の間に、GPUの価格、特にNVIDIAとAMDの最新世代のグラフィックカードの価格は正常化し、新規および既存のユーザーが必要なグラフィックカードを手頃な価格で購入できるよう、よりアクセスしやすく ...

PREV: AMD Ryzen Threadripper PRO 3995WX Workstation CPUは、多くのZen 2コアを搭載し、WRX80プラットフォームでI/Oが増加する。
NEXT: Intel Core i7 vPROの「Rocket Lake-S」CPUは8コアと12(?)スレッドになる