AMDは、2023年までに稼働する米国エネルギー省またはDOEの2つのExaflop El Capitanスーパーコンピューターに次世代のEPYCおよびRadeonアクセラレーターを搭載し、HPCセクターでの大きな勝利を発表しました。
AMDは、2023年までに稼働する米国エネルギー省またはDOEの2つのExaflop El Capitanスーパーコンピューターに次世代のEPYCおよびRadeonアクセラレーターを搭載し、HPCセクターでの大きな勝利を発表しました。
AMDのEPYCGenoaとRadeon Instinct HPCアクセラレーターが2つのExaflop「El Capitan」スーパーコンピューターを駆動
Intel、AMD、NVIDIAを含む3つの巨人はすべて、DOEの最新のスーパーコンピューターの契約を獲得するために競っていましたが、AMDはCPUとGPUの両方で勝っているようです。
El Capitanは、HPEのCrayスーパーコンピューティング部門によって構築され、AMDの次世代アクセラレーターを使用して、2023年までにこのエクサフロップモンスターに命を吹き込みます。
スーパーコンピューターは、ローレンスリバモア国立研究所に配備され、1秒あたり最大2キンテリオンの計算を実行できます。
「2023年に研究室に納入されると、世界最速のスーパーコンピューターになると予想されます」と、LivermoreラボのディレクターであるBill Goldstein氏は述べています。
システム全体の組み立てには6億ドルかかり、現在LLNLに展開されているSierra(IBM Power 9 + NVIDIA Volta)スーパーコンピューターよりも少なくとも16倍高速です。
システム自体の仕様に関しては、EPYC GenoaがCPU側に電力を供給し、次世代のRadeon InstinctアクセラレーターがGPU側に電力を供給することがわかっています。
システムが稼働すると、システム全体の消費電力は40MW未満になります。
以下は、El Capitanスーパーコンピューターに含まれるAMDテクノロジーのリストです。
- 「Zen 4」プロセッサコアを搭載した「Genoa」というコードネームの次世代AMD EPYCプロセッサ。これらのプロセッサは、AIおよびHPCワークロード用の次世代メモリおよびI / Oサブシステムをサポートします。
- HPCやAIを含むワークロード向けの新しいコンピューティング最適化アーキテクチャに基づく次世代Radeon Instinct GPU。これらのGPUは、次世代の高帯域幅メモリを使用し、最適な深層学習パフォーマンスのために設計されています。
- 第3世代AMD Infinityアーキテクチャ。ElCapitanの各ノードに含まれる4つのRadeon Instinct GPUと1つのAMD EPYC CPUの間に高帯域幅で低遅延の接続を提供します。同様に、第3世代のAMD Infinityアーキテクチャには、CPUとGPUにまたがる統合メモリが含まれており、高速コンピューティングへのプログラマーのアクセスを容易にし、
- AMD CPUとGPUのパフォーマンスを組み合わせて最大限のパフォーマンスを引き出すために開発された、オープンソースROCm異種プログラミング環境の拡張バージョン。
AMD EPYC Genoa-7nm以降のZen 4コア、SP5ソケットプラットフォーム、DDR5メモリ、PCIe 5.0プロトコル
Zen 4コアアーキテクチャに基づくAMD EPYC Genoaプロセッサーは、AMDがEPYC Romeの発売時に最新のロードマップで公式に発表するまで謎でした。
現在、2021年に計画された発売を予定しているジェノアのラインナップは、サーバーランドスケープにまったく新しい機能セットをもたらします。
AMDは、EPYC Genoaは新しいソケットをもたらす新しいSP5プラットフォームと互換性があり、SPY互換性がEPYC Milanまで存在することを発表しました。
EPYC Genoaプロセッサは、新しいメモリと新しい機能のサポートも備えています。
AMDが2021年にDDR5の時流に乗るのは間違いないようです。
また、新しい機能がEPYC Genoaに導入され、PCIe 4.0の帯域幅を2倍にし、x16インターフェイスで128 Gbpsのリンク速度を提供する新しいPCIe 5.0プロトコルのヒントのように聞こえます。
EPYC Genoaのすべてをまとめると、次の主な機能を検討しています。
- 7nm以降のZen 4コア
- 新しいソケットを備えたSP5プラットフォーム
- PCIe 5.0のサポート
- DDR5メモリのサポート
- 2021年に発売
Radeon Instinct側では、非常に強力で、おそらく7nm未満のGPUベースのグラフィックアクセラレータを検討しています。
AMDは現在、コードネーム「Arcturus」で、伝えられるところによると最大8192個のストリームプロセッサと32GBのHBM2eメモリを搭載したRadeon Instinct Mi100アクセラレータを発売する準備を進めています。
GPUはそれ自体が間違いなく獣ですが、2020年の発売が予定されており、それらが将来の使用を保証するために、El Capitanスーパーコンピューターは間違いなくRadeon Instinct Mi100よりも新しいものを展開するでしょう。
正確なグラフィックスカードまたはアクセラレータについては言及されていませんが、新しいGPUは次のような新しいコンピューティングアーキテクチャを提供すると述べられています。
- HPCおよびAI向けに最適化
- 深層学習のパフォーマンスを最適化するための広範な混合精度Ops
- 次世代の高帯域幅メモリ
- マルチGPUスケーリングでパフォーマンスを最大化
機能セットに基づいて、HBM2eとPCIe Gen 4を超えて、2021年までにすぐに利用可能になり、エルキャピタンが2023年に運用可能になるものを確実に探しています。
GPUは、コンピューティング/ AI / HPCワークロード向けに特別に設計されたとも言われており、つまり、NVIDIAのHPCアクセラレータのように、一般消費者向けで目にするチップではなく、そのセグメントのカスタムデザインになるということです。
また、El Capitanの3番目の主要な機能は、各AMD CPU / GPUアクセラレーターに第3世代のInfinity Fabricインターコネクトが装備されることです。
Infinity Fabric 3.0として言及されている新しい相互接続により、CPUとGPU間の高帯域幅と低遅延の接続が可能になり、CPUとGPU全体で統一されたメモリが可能になり、プラットフォームの一貫した性質により全体的なパフォーマンスが向上し、プログラミングが簡素化されます。
AMDが投稿したスライドでは、各ノードに4つのRadeonアクセラレータがあり、Infinity Fabric 3.0を介してAMD EPYC Genoaプロセッサに直接リンクされているようです。
現在200 Gb / sの帯域幅をプッシュしているCray独自のSlingshotファブリックに加えて使用されますが、将来のバージョンではEl Capitanインフラストラクチャにより多くの相互接続帯域幅を提供できる可能性があります。
ここでの違いは、Slingshotはよりノード間チャネルであり、Infinity Fabricはより近いCPU-GPU相互接続であるということです。
At #oghpc, @BradleyMccredie of @AMD (presenting virtually) makes the argument not only for heterogeneous computing, but additionally cache coherency between CPU and GPU. #HPC pic.twitter.com/Nuut23grk4
— Addison Snell (@addisonsnell) March 2, 2020
翻訳
#oghpcでは、@ AMDの@BradleyMccredie(仮想的に提示)は、異種コンピューティングだけでなく、CPUとGPU間のキャッシュ・コヒーレンシについても議論しています。
※キャッシュコヒーレンシ(英: cache coherency)とは、共有リソースに対する複数のキャッシュの一貫性を意味する。 キャッシュコヒーレンシはメモリ一貫性の一種である。 複数のクライアントが共有メモリリソースのキャッシュを保持するとき、キャッシュ間のデータの不一致という問題が生じる。
また、メモリだけでなく、CPUとGPUの間にキャッシュの一貫性があり、これは将来のHPCプラットフォームにとって大きな問題になると言われています。
異種プラットフォームの利点を示すスライドがAMDによって紹介され、Addison SnellがTwitterフィードで共有しました。これにより、将来のコンピューティングおよびアクセラレーションプラットフォームに何が期待できるかがわかります。
そうは言っても、AMDは明日、ファイナンシャルアナリストデーを開催します
プレゼンテーション中に、Zen 4と前述のRadeon Instinctアクセラレータの詳細を間違いなく期待できます。
解説:
HPCの案件から、早くもZen4コアの仕様の一部とArctrusの仕様が流出
ローレンスリバモア国立研究所に設置されるスーパーコンピューターにZen4とArctrusが使用されます。
- 7nm以降のZen 4コア
- 新しいソケットを備えたSP5プラットフォーム
- PCIe 5.0のサポート
- DDR5メモリのサポート
- 2021年に発売
Zen4はすでに上のような仕様が確定しているようです。
また、Aructrusはコア数(SP数)8192ということで、こちらもほぼnVidiaの次世代GPU RTX3000シリーズ(Tesla A100?)とほぼ同程度の規模になるようです。
HPC戦線に異状あり
近年だとこうした大型の案件はXeon+Teslaなどが取っていっていたのですが、今回は両方ともAMDが持って行ったということです。
GPUに関してはHPC向けのものですから、ゲーム向けとして性能が出るのかわかりません。
Vegaはゲームには向いていなかったGPUといわれています。
高速、高価なHBMメモリを搭載していたにもかかわらず、性能は奮いませんでした。
しかし、RTX3000シリーズと同程度の規模を持つGPUが用意されていることは確かで、ポスト7nmで製造されるGPUは8192SPクラスになる可能性が非常に高いといってもよいでしょう。
Navi10は2560SPで、Big Naviが5120SPといわれていますから、その後に8192SPクラスのモンスターがさらに控えている可能性が高いということになります。
このモンスターが出るとすれば2021年から2022年でしょうから、その時RTX3000シリーズを撃墜できるのかどうかでAMD GPUの真価が決まるのかもしれません。
AMDのGPU Radeonシリーズ
Radeon 7000シリーズ
Radeon RX 6000シリーズ
※ SAPPHIREはAMD Radeon専業のメーカーであり、Radeonのリファレンス的なメーカーです。