NVIDIA「Ampere」の後継者がコードネーム「Hopper」と伝えられる
NVIDIAは、最初のリンカーの1つを発明した著名なコンピューター科学者であるGrace Hopperに敬意を表して、GPUアーキテクチャ「Hopper」をコードネーム化し、第二次世界大戦でのアメリカの戦争活動を支援するハーバードマークIコンピューターをプログラムしたと伝えられています
これは、NVIDIAの情報でヒット率がかなり高いTwitterユーザー「@ kopite7kimi」がコードネームだけでなく、NVIDIAの製品設計の重要な変更をツイートしたときに明らかになりました。
ツイートは後で削除されましたが、その前に3DCenter.orgが記事にしました。
3dcenter.org – Hardware- und Nachrichten-Links des 11./12. November 2019
そもそも、「Hopper」は、2020年前半に予定されている「Ampere」アーキテクチャを継承していると伝えられています。
「Hopper」は、複数のGPUダイを備えたパッケージであるMCM(マルチチップモジュール)GPUパッケージを導入すると噂されています。 現在、GPU MCMは、メモリダイまたはスタックに囲まれた1つのGPUダイを持つパッケージです。
GPUダイのこの組み合わせは、少なくともパフォーマンススペクトルのハイエンドで「ジャイアントコア」を構成する可能性があります。
NVIDIAは、最も高価なTeslaファミリのコンピューティングアクセラレータまたはQuadroプロフェッショナルグラフィックスカードのみにMCMを予約し、クライアントセグメントGeForce製品を提供することはほとんどありません。
ソース:techpowerup – NVIDIA “Ampere” Successor Reportedly Codenamed “Hopper”
噂l:おそらく最初のnVidia Ampere世代の技術データ
私たちのフォーラムから、明らかに、nVidiaがEUVを使用した7nm生産の運用能力を待っているnVidiaのその後のAmpere世代に関する最初の技術情報が明らかになりました。
「Ampere」は2018年に一度噂されていましたが、この名前は誤解が生んだものでした。-nVidiaによって計画され、夏の終わりにリリースされたグラフィックカード世代は最終的には「Turing」でした。
現在、Ampere世代は実際に稼働していますが、レイトレーシングのパフォーマンスの向上などの明らかな前提を除いて、現在のところほとんど何の(情報も)手元にありません。
しかし、現在流れている噂は、特定の技術的アプローチに初めて触れており、ソースはもちろん比較的新しく、全体が完全に空いています。
nVidia Ampere HPC
sichere Infos: GA100-Chip mit 6144 Bit HBM2-Interface, doppelte Anzahl Tensor-Cores per Shader-Cluster
sichere Infos: GA101-Chip als halber GA100-Chip mit 3072 Bit HBM2-Interface (angeblich kürzlich gecancelt)
unsichere Infos: GA100-Chip mit 8 GPC mit jeweils 8 TPC = 8192 Shader-Einheiten, beide HPC-Chips unter 7nm+ TSMC (mit EUV)
nVidia Ampere Gaming
unsichere Infos: insgesamt 5 Chips, allesamt unter 7nm Samsung (mit EUV)Quelle: Twitter-User ‘Kopite7Kimi’, Original-Postings inzwischen gelöscht, sinngemäße Kopien im 3DCenter-Forum gesichert
これの出発点は、Ampere世代のさまざまなバージョンでのTwitterユーザー「Kopite7Kimi」のさまざまな投稿です。削除される前に注意深くフォーラムで保護しました。
そのTwitterユーザーはこれまでのところ素晴らしい外観を見せていませんが、実際のソースを所有しているようです-nVidiaの「SUPER」シリーズに関する非常に初期の情報のいくつかがそこに示しているように。
しかし、それはプラス側で終わります-全体はかなり不確実なコーナーからの噂であり、したがって、おそらく「噂ミル」を与えられたメッセージタイトルのシールの前にはほとんど投稿に値しないでしょう。
一方、そのようなことは確かに議論のアンカーとして役立つことができます-それが正しくない場合、遅かれ早かれ判明し、そうである場合、このデータは初めて文書化され、議論に備えられます。
さらに、実際に立ち入り禁止または達成不可能なことは何も約束されていません-実際には、前述の推測の多くをすでに推測できます。
これには、たとえば、TSMC(HPCチップ)とサムスン(ゲーミングチップ)の分割生産が含まれます。
これらは、さまざまなnVidiaの声明からすでに多かれ少なかれ明らかにされており、両チップメーカーが努力しています。
6144ビットHBM2インターフェイスに8192シェーダーユニットを備えたより大きなHPCチップ「GA100」でさえ、このデータでは予想外に大きくなりません。-これは、以前のVolta世代のGV100チップ(4096ビットHBM2インターフェイス上の5376シェーダーユニット)と比較して、2倍でもありません。
もちろん、これはタスクに依存してはいけません。nVidiaは明らかに(少なくともこのHPCチップに)インストールされているので、Tensorコアの数の2倍です。おそらく、GA100チップの2048個と同じ量です。-そして、それはGV100チップの3倍のサイズです(フル構成での672Tensorコア)。
8192シェーダーユニットは、元の噂では直接名前が付けられていない可能性があります(再構成はできません)が、その数は8 GPC(グラフィック処理クラスター)から導出され、各GPCは8 TPC(テクスチャ処理クラスター)を運ぶことになっていますこの
ため、チップ全体で512個のテクスチャユニットが利用できる可能性があります。 nVidiaがこれまでに16:1のSE / TMU比を変更していない限り、これらの512テクスチャユニットは論理的に前述の8192シェーダーユニットになります。
nVidia GA100
HPC/Profi-Lösung der Ampere-Generation
8 Raster-Engines (Graphics Processing Cluster, GPC) mit jeweils 16 Shader-Cluster (Streaming Multiprocessor, SM) samt jeweils 8 Texturen-Cluster (Texture Processing Cluster, TPC)
jeder Shader-Cluster enthält höchstwahrscheinlich (wie bisher) 64 Shader-Einheiten (CUDA Cores, CU) samt 4 Texturen-Einheiten (Texture Mapping Unit, TMU), aber gleich 16 Tensor-Cores (verdoppelt gegenüber Ampere)
ergibt insgesamt 128 Shader-Cluster, welche insgesamt 8192 Shader-Einheiten, 512 Texturen-Einheiten und 2048 Tensor-Cores enthalten
PCI Express 4.0 (eigene Annahme, aber wahrscheinlich)
7nm+ (EUV) Fertigung von TSMC
Release irgendwann im Jahr 2020
特定の値を達成できるのはGPCとTPCの特定の比率のみであるため、他の計算(TMU / TPCとSE / TMUの異なる比率を使用)は意味をなしません。-これは、4096、8192、または16384シェーダーユニット間の単純な決定に相当します。
ただし、4096シェーダーユニットでは、このNextGenチップは小さすぎ、16384シェーダーユニットでは大きすぎます-エルゴは、この状況に基づいて、ほとんど8192シェーダーユニットのみに基づくことができます。
6つのHBMスタックと6144ビットのインターフェイス幅を持つ特定のメモリインターフェイス(フォーラムの投稿では誤って「6072ビット」と呼ばれますが、これは1024ビットの倍数に基づくHBMメモリインターフェイスの基本構造の観点からは機能しません) )確かに非常によくフィットし、最終的に、Volta世代GV100チップと比較して、シェーダーユニットが52%増え、+ 50%広いメモリインターフェイスが追加されました。
もちろん、クロックレートと内部セットアップのさらなる改善が期待されており、HPCエリアの全体的なパフォーマンスの向上は、ほぼ2倍になる可能性があります。理想的な場合と、今日の観点から言うと、当然のことです。
HPC向けのGA100チップでは、アンペアポートフォリオのチップチップを使用しています。これはおそらくGA101の形式の2番目のHPCチップに続くはずですが、最近削除されたと言われています。
GA100のスムーズな半分として、GA101はとにかく多くの注目を集める可能性は低い-そして、ゲームセグメントに新しい最先端のソリューションを提供することができたとしても、小さすぎる可能性があります。
しかし、4096個のシェーダーユニットが到達可能な範囲よりもかなり大きなハードウェア能力を備えているため、Turing世代の現在のTU102チップは、すでに4608個のシェーダーユニットを搭載しています。
nVidiaがHPCとゲームセグメント間の最近の展望をどのように処理したかから判断すると、Ampereの最大のゲームチップ(「GA102」)は6000〜7000シェーダーユニットと推定されます。
nVidiaは確かにGA100と同じ数のシェーダーユニットを使用できますが、これはおそらくクロックレートと有効性を上回るはずです。-これが、nVidiaが最近、最大のゲーミングチップ向けに、シェーダーユニットの数がわずかに少なく、クロックレートが高いモデルをリリースした理由です。
チップ型番 | 市場セグメント | 予想されうる製品 | 仕様 | 旧製品 |
GA100 (別名AM100) |
HPC | Tesla & Titan | 8192 SE @ 6144 Bit HBM2 |
GV100: 5376 SE @ 4096 Bit HBM2 |
GA101 (別名AM101) |
HPC | Tesla & Titan | 4096 SE @ 3072 Bit HBM2 |
– |
GA102 (別名AM102) |
エンスー | GeForce RTX 3080 Ti |
ca. 6000-7000 シェーダーユニット |
TU102: 4608 SE @ 384 Bit GDDR6 |
GA104 (別名AM104) |
ハイエンド | GeForce RTX 3070 & 3080 |
ca. 4000-5000 シェーダーユニット |
TU104: 3072 SE @ 256 Bit GDDR6 |
GA106 (別名AM106) |
ミドルレンジ | GeForce RTX 3060 | ca. 2500-3000 シェーダーユニット |
TU106: 2304 SE @ 256 Bit GDDR6 & TU116: 1536 SE @ 192 Bit GDDR6 |
GA107 (別名AM107) |
メインストリーム | GeForce RTX/GTX 3050 |
ca. 1500-1800 シェーダーユニット |
TU117: 1024 SE @ 128 Bit GDDR5 |
GA108 (別名AM108) |
ローコスト | GeForce RTX/GTX 3040 |
ca. 1000 シェーダーユニット |
– |
残りの(おそらく5つの)ゲーミングチップのギルドは、それに基づいて大まかに分類できます。-現在、チップ名、チップ割り当て、およびそれらのハードウェアデータは純粋に投機的であり、おそらくさらなる思考の出発点を提供します。
nVidiaのAmpereポートフォリオが合理的に似ている場合(上記のスケッチを参照)、nVidiaは各市場セグメントで30〜70%多いシェーダーユニットを持つことになります。
さらに、Tensorコアの基本的な2倍の増加があり、シェーダーユニットが+ 50%増加すると想定されるグラフィックチップでは、Tensorコアが+ 200%増加します。
アンプの下にあるレイトレーシングユニットの場合と同様に、これはまだ見られませんが、nVidiaは少なくともTensorコアと同じ開発の進捗状況を提示することを確かに望んでいると推測できます。
したがって、Ampere世代のレイトレーシングとTensorコアは引き続き重量が増加するか、相対的な占有チップ面積が増加します。
これは、レイトレーシングのアイデアを進めるというnVidiaの目標により、最終的には予想されないことです。
これらすべての予測と仮定が合理的に正しい場合、Ampere世代は(平均)+ 50%から+ 70%の定期的なパフォーマンスの向上が期待されますが、RayTracingのパフォーマンスは+ 100%から+ 150%になる傾向があります。
後者の点では、より多くの可能性があります-これは、ハードウェア仕様で重要なポイントとして言及されていなかったRayTracingユニットの増加によるものです。
いずれにせよ、TensorコアとRayTracingコアのコストが上昇するため、シェーダーユニットではおそらく30〜70%のプラスにすぎないにもかかわらず、トランジスタ数はほぼ2倍になることが予想されます。-これは以前の大きな世代のジャンプに対応しています。
ただし、nVidiaは、RayTracing時代のトランジスタパフォーマンス全体を通常のパフォーマンスの向上に割り当てず、代わりにRayTracingのパフォーマンスの向上にのみ大きな部分を割り当てます。
そして、2020年のクリスマスに予定されている次期のNextGenコンソールを考えると、これは確かに理にかなっています。
残念ながら、nVidiaのアンペア世代について新しいことは何も言えません。2020年には確実に開始されますが、より正確には、これはまだ想像できません。
ソース:3dcenter.org – Gerüchteküche: Angeblich allererste technische Daten zu nVidias Ampere-Generation
解説:
Techpowerupの記事の中に、3dcenter.orgというサイトからの興味深い記事があったので紹介します。
ちなみに、ドイツ語ですので、慣用表現などが含まれている部分の翻訳はあきらめています。
頑張って読み込もうとされる方へ向けての情報となりますので、ご了承ください。
はっきり書きます。「わからない人、原文を見て自分で解釈しようとしない人」に関しては今回の情報はわからないままになると思います。
私のドイツ語能力はほぼ0に近いので、ご了承ください。
その内容はすさまじいもので、今の各モデルに相当するものより+30-70%シェーダーユニット数が増えます。
Tensorコアは+200%前後、レイトレーシングのパフォーマンスは+100-150%向上すると予想されています。
また、基本的に私が懸念していたメモリ帯域の問題はシェーダーユニット数が増えたことに合わせて、メモリのバス幅を広げて対応するものと思われます。
例:
RTX2080/2070の後継が12GB
GTX1660系の後継が8GB
GTX1650の後継が6GB
などです。
これによってメモリのバス幅が広がり最終的な帯域も広くなります。
また現在の12/14Gbpsに加えて16Gbpsや18GBpsといったより高速なメモリも使われることになるでしょう。
それでも最上位の製品(Titan)はHBM2メモリを使うことになると予想されているようです。