AMDの次世代Zen 4ベースのEPYC GenoaおよびRadeon Instinctは、最大2EXA-FLOPSの計算能力でEl Capitanスーパーコンピューターに搭載される

AMDは、2023年までに稼働する米国エネルギー省またはDOEの2つのExaflop El Capitanスーパーコンピューターに次世代のEPYCおよびRadeonアクセラレーターを搭載し、HPCセクターでの大きな勝利を発表しました。

AMDのEPYCGenoaとRadeon Instinct HPCアクセラレーターが2つのExaflop「El Capitan」スーパーコンピューターを駆動

Intel、AMD、NVIDIAを含む3つの巨人はすべて、DOEの最新のスーパーコンピューターの契約を獲得するために競っていましたが、AMDはCPUとGPUの両方で勝っているようです。

El Capitanは、HPEのCrayスーパーコンピューティング部門によって構築され、AMDの次世代アクセラレーターを使用して、2023年までにこのエクサフロップモンスターに命を吹き込みます。

スーパーコンピューターは、ローレンスリバモア国立研究所に配備され、1秒あたり最大2キンテリオンの計算を実行できます。

「2023年に研究室に納入されると、世界最速のスーパーコンピューターになると予想されます」と、LivermoreラボのディレクターであるBill Goldstein氏は述べています。

システム全体の組み立てには6億ドルかかり、現在LLNLに展開されているSierra（IBM Power 9 + NVIDIA Volta）スーパーコンピューターよりも少なくとも16倍高速です。

システム自体の仕様に関しては、EPYC GenoaがCPU側に電力を供給し、次世代のRadeon InstinctアクセラレーターがGPU側に電力を供給することがわかっています。

システムが稼働すると、システム全体の消費電力は40MW未満になります。

以下は、El Capitanスーパーコンピューターに含まれるAMDテクノロジーのリストです。

「Zen 4」プロセッサコアを搭載した「Genoa」というコードネームの次世代AMD EPYCプロセッサ。これらのプロセッサは、AIおよびHPCワークロード用の次世代メモリおよびI / Oサブシステムをサポートします。
HPCやAIを含むワークロード向けの新しいコンピューティング最適化アーキテクチャに基づく次世代Radeon Instinct GPU。これらのGPUは、次世代の高帯域幅メモリを使用し、最適な深層学習パフォーマンスのために設計されています。
第3世代AMD Infinityアーキテクチャ。ElCapitanの各ノードに含まれる4つのRadeon Instinct GPUと1つのAMD EPYC CPUの間に高帯域幅で低遅延の接続を提供します。同様に、第3世代のAMD Infinityアーキテクチャには、CPUとGPUにまたがる統合メモリが含まれており、高速コンピューティングへのプログラマーのアクセスを容易にし、
AMD CPUとGPUのパフォーマンスを組み合わせて最大限のパフォーマンスを引き出すために開発された、オープンソースROCm異種プログラミング環境の拡張バージョン。

AMD EPYC Genoa-7nm以降のZen 4コア、SP5ソケットプラットフォーム、DDR5メモリ、PCIe 5.0プロトコル

Zen 4コアアーキテクチャに基づくAMD EPYC Genoaプロセッサーは、AMDがEPYC Romeの発売時に最新のロードマップで公式に発表するまで謎でした。

現在、2021年に計画された発売を予定しているジェノアのラインナップは、サーバーランドスケープにまったく新しい機能セットをもたらします。

AMDは、EPYC Genoaは新しいソケットをもたらす新しいSP5プラットフォームと互換性があり、SPY互換性がEPYC Milanまで存在することを発表しました。

EPYC Genoaプロセッサは、新しいメモリと新しい機能のサポートも備えています。

AMDが2021年にDDR5の時流に乗るのは間違いないようです。

また、新しい機能がEPYC Genoaに導入され、PCIe 4.0の帯域幅を2倍にし、x16インターフェイスで128 Gbpsのリンク速度を提供する新しいPCIe 5.0プロトコルのヒントのように聞こえます。

EPYC Genoaのすべてをまとめると、次の主な機能を検討しています。

7nm以降のZen 4コア
新しいソケットを備えたSP5プラットフォーム
PCIe 5.0のサポート
DDR5メモリのサポート
2021年に発売

Radeon Instinct側では、非常に強力で、おそらく7nm未満のGPUベースのグラフィックアクセラレータを検討しています。

AMDは現在、コードネーム「Arcturus」で、伝えられるところによると最大8192個のストリームプロセッサと32GBのHBM2eメモリを搭載したRadeon Instinct Mi100アクセラレータを発売する準備を進めています。

GPUはそれ自体が間違いなく獣ですが、2020年の発売が予定されており、それらが将来の使用を保証するために、El Capitanスーパーコンピューターは間違いなくRadeon Instinct Mi100よりも新しいものを展開するでしょう。

正確なグラフィックスカードまたはアクセラレータについては言及されていませんが、新しいGPUは次のような新しいコンピューティングアーキテクチャを提供すると述べられています。

HPCおよびAI向けに最適化
深層学習のパフォーマンスを最適化するための広範な混合精度Ops
次世代の高帯域幅メモリ
マルチGPUスケーリングでパフォーマンスを最大化

機能セットに基づいて、HBM2eとPCIe Gen 4を超えて、2021年までにすぐに利用可能になり、エルキャピタンが2023年に運用可能になるものを確実に探しています。

GPUは、コンピューティング/ AI / HPCワークロード向けに特別に設計されたとも言われており、つまり、NVIDIAのHPCアクセラレータのように、一般消費者向けで目にするチップではなく、そのセグメントのカスタムデザインになるということです。

また、El Capitanの3番目の主要な機能は、各AMD CPU / GPUアクセラレーターに第3世代のInfinity Fabricインターコネクトが装備されることです。

Infinity Fabric 3.0として言及されている新しい相互接続により、CPUとGPU間の高帯域幅と低遅延の接続が可能になり、CPUとGPU全体で統一されたメモリが可能になり、プラットフォームの一貫した性質により全体的なパフォーマンスが向上し、プログラミングが簡素化されます。

AMDが投稿したスライドでは、各ノードに4つのRadeonアクセラレータがあり、Infinity Fabric 3.0を介してAMD EPYC Genoaプロセッサに直接リンクされているようです。

現在200 Gb / sの帯域幅をプッシュしているCray独自のSlingshotファブリックに加えて使用されますが、将来のバージョンではEl Capitanインフラストラクチャにより多くの相互接続帯域幅を提供できる可能性があります。

ここでの違いは、Slingshotはよりノード間チャネルであり、Infinity Fabricはより近いCPU-GPU相互接続であるということです。

At #oghpc, @BradleyMccredie of @AMD (presenting virtually) makes the argument not only for heterogeneous computing, but additionally cache coherency between CPU and GPU. #HPC pic.twitter.com/Nuut23grk4
— Addison Snell (@addisonsnell) March 2, 2020