ある有名なリーカーが、次期NVIDIA Ampereダイは627mm²の大きさになるとコメントしています。
このソースは信頼できるものですが、彼らは、現時点では100%噂なので、割り引いて考えて、額面通りに受け取らず、確信が持てないという注釈を付けています。
NVIDIAがゲーム用AmpereのラインナップをSamsungの8nmノードに移動し、627mm²がレチクルの上限に達しているため、これが事実であるとしても驚くに値しません。(それは確かに高くなるでしょうが、この時点で歩留まりは大幅に低下します)。
NVIDIAのゲーミング向け大型Ampere GPUが627mm²の大きなダイになる?
このツイートが事実であることが判明したとしても、これがSKU10のことを指しているのか、20のことを指しているのか、30のことを指しているのかは現時点ではわからないことを覚えておいてください。
RTX 2080 Tiは754mm²だったが、16nmプロセス(12NFFは基本的に最適化された16nm FF)をベースにしていた。
サムスンの8nmプロセス(これは基本的に10nmに最適化されています)に移行すると、パフォーマンスを一定に保ちながら、消費電力をわずかに増加させるために、少なくとも30%以上の密度を高くすることが出来ます。
これは、12NFFプロセスで製造された895mm²のGPUに相当します。
627mm2
— KatCorgi (@KkatCorgi) July 8, 2020
このチップの予想されるパワーレベルに基づいて、我々はこれがゲーミング用のビッグ Ampere GPUであると予想しています。
これはRTX 3090かRTX 3080 / Tiモデルかもしれない。
1 つ確かなことは, NVIDIAはこのラインナップのいくつかの非常に強力なGPUを展開することを計画しており、これがどのSKUであるかにかかわらず、大幅なパフォーマンスの向上を得られるでしょう。(うまくいけば、コストパフォーマンスも高くなります)。
TSMCからSamsungへのシフトも、
1) Samsungにはプロセスを安く提供できるだけの十分な資金があり、
2) NVIDIAの要求を満たすだけの十分な量があることを考える
と、ここでは論理的な動きかもしれない。
Samsungの8nmプロセスは、10nmのバックボーンをベースにしており、10nmよりも10%以上エネルギー効率が高い。
8nmは、NVIDIAの12NFF(これは基本的には16nmの最適化版に過ぎない)からの大幅な性能のジャンプであり、同社は、より多くの演算能力を供給することで、低いエネルギー効率を非常に簡単に補うことができます(これは、以前に見たRTX 3090の高いTGP定格を説明するものかもしれません)。
ところで、Igorはまた、サムスンへの生産を移すことを確認しました。
我々は当初、NVIDIAが(RTX 3090のような)高性能な部品はTSMCの7nmプロセスに、低価格な部品はSamsungに、というように、段階的に発売するのではないかと聞いていたが、Kopite氏によると、すべての製品とゲームセグメントはSamsungの8nmプロセスをベースにする予定であり、100%の確信を持っているとのことだ。
つまり、RTX 3090、RTX 3080、3070などのSKUは全て8nmプロセスを採用することになる。
プロセスはTSMCよりも効率的ではないので、NVIDIAは、我々がリークされたベンチマークで見てきた大規模なパフォーマンスの飛躍を与えるために、ボード全体でTGPを増加させる必要があります(無論それは目を見張るものです)。
このソースは、NVIDIAの将来のTegraプロセッサは、同様に同じプロセスに基づいていると以前にも述べています。
NVIDIAは、AMDがそのCPUとGPUで7nmの空き容量をすべて予約したときに、初めてTSMCに依存していることを感じた。
結局のところ、RTX 3000シリーズがTSMCの7nmプロセス上にあるか、Samsungの8nmプロセス上にあるかは本当に重要ではありません。
ソース:wccftech - NVIDIA’s RTX 3000 Series ‘Ampere’ Flagship Will Have 627mm² Large Die?
解説:
Ampereのあるモデルのダイサイズは627mm2?
これはおそらくGA102のダイサイズではないかとwccftechでは予想しています。
私がざっくりと計算したGA102のダイサイズは以下のようになります。
GA102の予想されるダイサイズ
GA100=826mm2(TSMC)、6912CUDAコア
GA102=824.71mm2、Samsung8nm、5376CUDAコア
トランジスタ密度
TSMC7nm=95.08MTr/mm2
Samsung8nm=61.58MTrmm2
※ wikichipより
GA102をSamsungの8nmで製造すると約824.71mm2となります。
※ CUDAコア数とトランジスタ密度から割り出したものです。ただしGA100とGA102がアーキテクチャー的にほとんど変わらないものと仮定し、CUDAコア数とトランジスタ数が正比例していると仮定した、かなりざっくりした計算であることはお断りさせていただきます。参考程度と言うことにしてください。
ただしこれはレティクルのサイズなどは全く考慮していませんので、リーカーのリーク情報の方が正しいのではないかと思います。
Samsung8nmで627mm2ってかなり小さいなと思います。
12nmで製造すると895mm2相当と言うことですから、TU102より一回り大きいだけと言うことになりますね。
ちなみにSamsung8nmをトランジスタ密度でTSMC7nmに合わせるとすると627mm2は約406mm2となります。
個人的にはGA100の826mm2と比較としてこれでは小さすぎるので、GA103かGA104じゃないのと思いますが、有名なリーカーさんがGA102と言うならその可能性の方が高いのでしょう。かなりがっかりです。
このダイサイズでCUDAコア数を上げつつ、TensorコアやRTコアの処理能力を2倍以上に引き上げることが可能なのかといぶかしく思います。
また627mm2でも歩留まりはあまり高くならないというような表現がありますので、コスト的にもどうなのかなと思います。
元々Samsungの8nmになったのはAMDが7nmを全部予約してしまったからと言う理由ですが、下手を打ったのかないう感じです。
RDNA2はゲーム機にも使われるアーキテクチャーですから、Vegaのようにゲーム性能が低いと言うこともなく、消費電力当たりの性能でAMDに負ける可能性も出てきたのかなと思います。
Samsung8nmのレティクル上限サイズが627mm2付近と言うのはかなりがっかりポイントです。
Big Naviが505mm2と言われていますので、Samsung8nmとトランジスタ密度で合わせると779mm2となり、GA102(?)よりさらに一回り大きくなります。
はっきり言って627mm2ではショボすぎるので、これで勝負になるのかどうかですねえ。
私としては間違いであってほしいところです。
Samsung8nmとTSMCの7nmを比べると、プロセスの数字だけを見るとそれほど変わらないように見えますが、10nmの改良に過ぎない8nmとはトランジスタ密度で1.54倍もの差があります。
果たしてこれでRDNA2に対抗できるものなのかどうかですね。
nVidiaのケチっぷりがゲーム用Ampereの性能に影響を与えるのか?
AmpereがTSMCの最先端プロセスから弾きだされたのは、SamsungとTSMCの間をフラフラと渡り歩いたからだと私は考えています。
一時期、nVidiaはSamsungのFabで生産するという噂が流れていましたが、過去にもこういう値下げ交渉ともとれるような行動を繰り返しています。
コストの削減は確かに大事ですけど、TSMCはもはや代替の効かない半導体Fabであり、あまりにガメツすぎると結局損をするという典型のような話ですねえ。
nVidia的にはTSMCは単なる下請けみたいなイメージなのかもしれません。
おかしな浮気をせずにTSMCに一直線だったAMDとの差がモロに出た形になります。
GeforceはGPUではかなりビッグネームですから、TSMCの最先端プロセスを使えないというのはかなり大きなマイナスです。
私はかなり落胆しました。
nVidia RTX4000SUPER
nVidia RTX4000
nVidia RTX3000シリーズGPU
RTX3060 12GB GDDR6
RTX3050 6GB