Intel Architecture Dayのアジェンダに関する詳細が明らかになるまで、皆が最も期待していたのはGPUのロードマップでした。
さて、プレスイベントの報道を読んだら、これは当てはまりませんが、インテルのGPU IPロードマップに関する最新情報があります。
主な更新は、インテルがGen 11グラフィックスとそのハイレベルな技術仕様を発表したことです。
インテルの10nm Gen11グラフィックス
Intel Gen 11グラフィックスは、Intelの最初のTFLOP級モバイルGPUになります。
この進歩によって、GT 1030(0.94 TFLOPしか得られない)は存在意義を失い、Intelの最初のdGPUレベル統合プロセッサの1つになりました(NUCのVega GPUは除外します)。
Gen 11グラフィックスは、1クロックあたり2倍の性能向上と簡素なピクセルシェーディングを備えています。
ここに公式のアナウンスがあります:
Intelは、1TFLOPSの壁を突破するように設計され、旧世代のIntel Gen9グラフィックス(24 EU)と比較すると64倍の高性能実行ユニットを備えた、新しいGen11統合グラフィックスを発表しました。
新しい統合グラフィックスは、2019年に始まる10nmベースのプロセッサで提供されます。
新しい統合グラフィックスアーキテクチャは、Intel Gen9グラフィックスと比較して、1クロックあたりのコンピューティング性能を倍増させることが期待されています。
> 1 TFLOPSのパフォーマンス機能を備えたこのアーキテクチャは、ゲームのプレイアビリティを向上させるように設計されています。
このイベントで、インテルのGen9グラフィックスと比較して、Gen11グラフィックスは一般的な写真認識アプリケーションの性能をほぼ倍増させることができました。
Gen11グラフィックスには、高度なメディアエンコーダとデコーダが搭載されており4Kビデオストリームと8Kコンテンツの制作を、限られたユニットの要求する消費電力ででサポートします。
Gen11は、Intel Adaptive Syncテクノロジを搭載し、ゲームのスムーズなフレームレートを実現します。
インテルはまた、2020年までに単体のグラフィックプロセッサを導入する計画を再確認しました。
1TFLOPレベルでは、1080pの低中位設定でほとんどのカジュアルゲームをプレイできるようになりました。
これは前世代に亘る驚異的なアップグレードであり、プロセッサーが発売後はIntelが市場シェアを獲得することは間違いありません。
もう1つの大きな改善点は、インテグレーテッド・シンクロ・テクノロジのサポートで、インテルをテクノロジをサポートする第2の主要プレーヤーにすることです。
NVIDIAは、独自のG-Sync技術を消費者にコストをかけて押し付ける唯一のプレーヤーです。
マルチディスプレイに加え、高解像度とHDRもサポートされています。
HEVCエンコーディングは、ハードウェアレベルとHDRトーンマッピングでもサポートされています。
iGPUはストリーミング目的にも最適です。
ALUは2x Float16(単精度浮動小数点演算)回路図に基づいており、実行単位の効率を大幅に向上させます。
また、すべての顧客層に、分散された処理能力へのアクセスを許可することで、グラフィックスを次のレベルに引き上げるGPU IPスケーラビリティに関する壮大なデザインを明らかにしました。
IntelはこれをX ^ eと呼び、テラフロップスからペタフロップスを目指す野望と呼んでおり、現在ロードマップにDatacenter、Enthusiast、Mid-Range、Integrated + Entryをリストしています。
インテルは、2020年までにディスクリートグラフィックスプロセッサを出荷する予定であることを確認しました。
ソース:wccftech - Intel’s 10nm Gen 11 Graphics Detailed – 1 TFLOPs of Power and Landing in 2019
解説:ついに次世代のintel内蔵GPUの詳細が発表されました。
モバイル向けのフル機能版GPUではnVidiaのエントリー向け単体GPUであるGT1030をついに超える性能を獲得するということです。
しかし、逆に言えば最大でもそれだけの性能しか得られないということです。
ここで発表されたのはモバイル向けの高性能版で、デスクトップPCに内蔵されるものはEU数(intelのGPUのコア数のようなもの)が落とされた低機能版になります。
この性能はGTX1050が1.8TFLOPSですから、約半分強程度ということになります。
内蔵GPUの向かう先
intelも内蔵GPUを強化する方向に動き出しました。
この進化は2016年に発売されたkabyLake HD600シリーズから、実に3年ぶりとなります。
※ UHD600シリーズはHD600シリーズに対してクロックがわずかに向上されただけのマイナーチェンジ版です。
世代もGen9からGen11と一世代スキップされており、普通の企業が1世代のスキップをした場合、開発費がペイできなくて倒産ものです。
全体的な傾向としてはx86には逆風で、縮小傾向ですが、intelはやはりすごい企業だと思います。
今回、何かものすごい進化を遂げたように感じると思いますが、現世代のintel内蔵GPUのトップモデル、Iris Plus Graphics 655が演算能力806-921GFLOPSですので、1割程度しか性能向上は果たしていません。
intel公式の発表ではなぜが前世代の一段下のグレードであるUHD630と比較しており、実にintelの大本営発表らしいやり方だと思います。
モバイルの高性能版は128MBのeDRAMがキャッシュとして埋め込まれており、別格の性能を誇る特別版ですがデスクトップPCには内蔵されないので誤解しないようにしてください。
この性能を見ると2019年にIceLakeが出るとすればDDR4のままなのかなと思います。
内蔵GPUの性能に関してはやはりAMDに一日の長があるということです。
以前から何度も繰り返していますが、内蔵GPUの性能を決めるのはメモリの総合的なスピードです(メモリ帯域幅)。
DDR4のうちはどんなに頑張っても出せる性能は決まっています。
唯一の例外であるIris Plus Graphics 655のような高性能版はこのメモリのスピード(帯域幅)が足りないので128MBのeDRAMが搭載されています。
これはかなりコストが上がるので、高価な高性能モバイル向けにしか使えません。
また、キャッシュというのは効果がある場面が限られていますので、大量に高速のデータを読み出して処理するような用途には向きません。
ここでintelの内蔵GPUとメモリ帯域幅を見てみましょう。
演算性能(GFLOPS) | メモリ帯域幅(GB/s) | |
GTX1060 | 4000 | 192 |
GTX1050Ti | 2100 | 112 |
GT1030 | 948 | 48 |
UHD630 | 384-460 | 37.5/41.6 |
HD630 | 364-441 | 34.1/38.4 |
HD530 | 403-441 | 34.1 |
参考にnVidiaの単体GPUである
GTX1060=FullHDで最新ゲームのオプションを落とさずにプレイ可能
GTX1050Ti=FullHDで最新ゲームを中位程度のオプションでプレイ可能
GT1030=FullHDで最新ゲームのオプションを最低レベルにして何とかプレイ可能
を比較対象として挙げています。
これを見るとメモリの速度がダイレクトに性能に反映されているのがよくわかるのではないでしょうか。
GT1030はCPUとメモリを共用しておりませんので、純粋にGPUだけでその速度が使用できるということです。
設計によってはきれいに当てはまらないケースもありますが、普通は無駄を避けるため、一番足りないメモリのスピードに合わせて設計されています。
ここでDDR5世代のメモリ帯域幅(メモリの総合的な速度)を見てみましょう
これを見るとDDR5-4800でようやくGTX1050Tiの少し下程度になり、FullHDの最新ゲームを何とか中程度の品質でプレイ可能ということになります。
逆に言うと、2-3年後にはFullHDのゲームが内蔵GPUで何とかプレイ可能になるということです。
ここまでくるといつまでも同じところにとどまっていては単体GPUの存在価値がなくなってしまいます。
高性能GPUが無理をしてまでレイトレーシングやDLSSといった機能を搭載したり、4K HDRゲーミングを目指す意味が理解していただけるでしょうか?
2-3年後には4K HDRモニターも20,000円前後($200前後)で販売されているかもしれません。
単体GPUを購入し、PCゲーミングを志向されている方は全体的な方向性として4K HDRに向かっており、その流れをずっと進んでいくということを覚えておいてください。
立ち止まってしまえばあっという間に内蔵GPUの進化に飲み込まれてしまうということです。