自作PCユーザーがゲーム用PCの解説をします

自作ユーザーが解説するゲーミングPCガイド

IntelのXe-HP「高性能」DG2 GPUを発見– AMDのRDNA / CDNAとNVIDIAのアンペアに対するマニア向けとワークステーション製品の競合

投稿日:

インテルが次世代のXe GPUアーキテクチャを発表する準備をしているときに、Xe-HPとして知られるハイエンドの最初のリファレンスモデルが、インテルが発行したドキュメントに登場しました。

Intel Xe-HP GPUは、以前にIntelが示唆していたように、マニアクラスからワークステーション層のグラフィックスカードに至るまで、あらゆる分野で力を発揮します。

 

最新のオープンソースドキュメントで参照されているIntelのXe-HP「高性能」GPU-3番目の熱狂的ファンおよびワークステーションGPU参加者

IntelのXe GPUについてはよく耳にしますが、それらは主にXe-LPアーキテクチャーから派生した低電力部品です。

Xe-HPの「高性能」GPUは、TechHearerであるKomachi(HardwareLuxx経由)によって発見され、Iris PlusとUHDグラフィックスに関する情報を保持するIntelのオープンソースプラットフォームドキュメントの1つに隠されていました。

更新された「Gen 12 HP以降のEU(Execution Uni)での新しいシストリックパイプラインの追加」は、今後のGPUアーキテクチャへの初期の追加です。

しかし、Intelは現在Xe-LPから移行しており、ハイエンドグラフィックスにギアをシフトしているようです。

https://twitter.com/KOMACHI_ENSAKA/status/1247220841927958528?ref_src=twsrc%5Etfw

翻訳

[Intel]Intel®Iris®Plus GraphicsおよびUHD Graphics Open

ソースプログラマーズリファレンスマニュアル

ドキュメントの特定のセクションを以下に示します。

※ クリックすると別Window・タブで開きます。

 

以前にリリースされたテストドライバーは、IntelのXe-LPアーキテクチャがDG1またはDiscrete Graphics 1 GPUに電力を供給し、Xe-HPがDG2またはDiscrete Graphics 2 GPUに電力を供給すると述べました。

グラフィックスカードのDG2層については、テストドライバーで言及されたものを除いて、それぞれのパーツの実行ユニットと思われるものについても詳しく知りません。

ドライバーで言及されているバリアントは次のとおりです。

  • iDG1LPDEV = “Intel(R) UHD Graphics, Gen12 LP DG1” “gfx-driver-ci-master-2624”
  • iDG2HP512 = “Intel(R) UHD Graphics, Gen12 HP DG2” “gfx-driver-ci-master-2624”
  • iDG2HP256 = “Intel(R) UHD Graphics, Gen12 HP DG2” “gfx-driver-ci-master-2624”
  • iDG2HP128 = “Intel(R) UHD Graphics, Gen12 HP DG2” “gfx-driver-ci-master-2624”

EUが128、256、512の3つの部分が言及されました(これらはバス幅としても使用できますが、以前のGPUではこの数を使用してバス幅ではなくEU数を参照していました)。

EUが96のDG1が約2〜3 TFLOPにあることを考えると、128 EUチップは、クロックが実際にハイエンドGPUで十分にスケーリングされる場合、256 EUが約5-10 TFLOPを提供し、512 EUが約10-15 TFLOPのFP32計算出力を提供することで、約4-5 TFLOPになる可能性があります。

最新の記事では、Xe-HP GPUがどのように見えるかについての詳細情報を入手しました。

IntelのGPUデザインは、少なくとも視覚的にはNVIDIAに近く、単一のタイル内にいくつかのEUが詰め込まれているようです。

これは、NVIDIAがGPC(グラフィックス処理クラスター)内でいくつかのSMユニットを配置する方法に似ています。

各タイトルは512のEUで構成され、各EUには8つのコアがあります。

この場合も、インテルXe-HPとXe-LPのマイクロアーキテクチャーの設計は大きく異なります。

512 EUはシングルタイルGPUであり、インテルは最大4タイルのGPUを提供することを計画していると述べられていますが、それがコンシューマースペースでまったく意味があるかどうかはわかりませんが、ワークステーションセグメントで機能するかどうかはわかりません。

以下は、インテルのさまざまなMCMベースのXe HP GPUの実際のEU数と、推定コア数およびTFLOPです。

  • Xe HP(12.5)1タイルGPU:512 EU [Est:4096コア、12.2 TFLOP、1.5 GHz、150 Wを想定]
  • Xe HP(12.5)2タイルGPU:1024 EU [Est:8192コア、20.48TFLOP、1.25 GHz、300Wを想定]
  • Xe HP(12.5)4タイルGPU:2048 EU [Est:16,384コア、1.1 GHzを想定した36 TFLOP、400W / 500W]

4タイルのGPUは非常に印象的であり、それがRaja Koduriが最近のツイートで「すべてのGPUの父」と述べた理由かもしれません。

https://twitter.com/Rajaontheedge/status/1202393950771744768?ref_src=twsrc%5Etfw

翻訳

それはすべてXe HPです。ここ@intel Bangaloreのチームは、インドで設計された最大のシリコンがどこにでもある最大のシリコンになるまでの道のりの重要なマイルストーンを越えたことを祝いました。

チームはそれを「すべての平凡なもの」と呼んでいます

 

インテルのXe-HP GPUには、ダイサイズが異なる複数のモデルがある場合があります。
Xe-HPCアーキテクチャーに基づくIntelのPonte Vecchio GPUは実際にはMCM設計を利用し、高密度のHBMパッケージで囲まれたその中にいくつかのGPUクラスターを備えているため、これも注目に値します。

インテルは最新の7nmプロセスノードでXe HPCクラスGPUを製造します。

これは、インテルが以前に話していた主要な7nm製品でもあります。

インテルは、ForverosやEMIB相互接続などの新しく強化されたパッケージングテクノロジーを最大限に活用して、次のエクサスケールGPUを開発します。

プロセスの最適化に関して言えば、インテルが10 nm以上の7 nmプロセスノードに対して発表したいくつかの主要な改善点は次のとおりです。

  • 倍密度のスケーリングvs 10nm
  • 計画されたノード内最適化
  • デザインルールの4倍の削減
  • EUV
  • 次世代のFoverosおよびEMIBパッケージ

Xe-HPCマイクロアーキテクチャーに基づくPonte Vecchio GPUは、数千のEUに拡張されるため、Xe-LPまたはXe-HPのいずれかのバリエーションが低層タイル構成で使用される可能性が非常に高く、Ponte Vecchio MCMパッケージ内で紹介されました。

これらすべてが、現在AMDとNVIDIA GPUで構成されているエンスージアストおよびワークステーションのGPUスペースに3番目の参入者をもたらします。

IntelのXe-HP EnthusiastおよびWorkstationグラフィックスカードは、今年後半に発表される予定のAMDのRDNA2 / CDNA2およびNVIDIAのAmpere GPUに対抗するようです。

Intelは、最初にTiger Lake CPUを搭載したXe-LP搭載製品を発表し、次にコンシューマーおよびワークステーション市場向けのディスクリートグラフィックスカード製品に移行し、最後に2021年までにエクサスケールレースに参加します。

ソース:wccftech – Intel’s Xe-HP ‘High-Performance’ DG2 GPU Spotted – The Enthusiast & Workstation Competitor To AMD’s RDNA/CDNA & NVIDIA’s Ampere

 

 

解説:

エンスー向けXeのマニュアルが公開されたようです。

今まではDG1というローエンドモデルのリークしか出てきませんでしたが、2020年Q2にきてようやくGeforceでいえばRTX2080Tiに相当するモデルの話が出てきました。

演算性能でいえば、20.48TFLOPSはRTX3080Ti相当ということになると思います。

RTX2080Tiの演算性能の公称値が13.8TFLOPSですから、約1.5倍相当になります。

ただ、7nm版VegaであるRadeonVIIはゲームに向いてないといわれていて、演算性能はほぼRTX2080Tiと同じですが、ゲーム性能はRTX2080相当となっています。

元々はデータセンター用に設計されたもののようですので、これがどのくらいの性能を発揮するのかは出てみないとわからないといったところではないでしょうか。

私はRTX2070相当と言っていましたが、演算性能だけでいえば私の予測は外れたと言ってもよいでしょう。

その一つ上のモデルがラインナップされていたということになります。

最上位のモデルはTDPが400-500WということでPCI-Expressの電源供給範囲を露骨に超えていますので、明らかに一般ゲーマー向けでは無く除外しています。

Raja氏と言えばAMDでRadeon開発チームを率いていましたので、これでnVidiaのRTX3080Tiを追い抜くことがあるようならば、Radeonの執念と言ってもよいのではないかと思います。(笑

ソフト側の対応も今は無い状態だと思いますので、可能かどうかは微妙ですが、第一世代のXeでAmpereを撃墜できれば大殊勲でしょう。

 

 

 

 

 

  • B!