インテルが本日発表したCXLのプレゼンテーションの中に、Xe GPUの野望の将来についてのヒントがあることに気づくことはできませんでした。
それはどこにも明示的に述べられていませんでした - それは私にとってかなり明白な意味合いを持っているようです。
用語をコインにする時間:コヒーレントマルチGPU。 CXLは、PCIeプロトコルに関する多くの問題を解決するために設計されたIntelの新しいインターコネクトレイヤであり、Multi-GPUが適切に機能しなくなった主な理由の1つは、コヒーレンシの欠如によるものです。 将来的にはXe GPUが「CXLモード」で動作するようになると思われます。
インテルが本日発表したCXLのプレゼンテーションの中に、Xe GPUの野望の将来についてのヒントがあるとは思えませんでした。
それはどこにも明示的に述べられていませんでした - それは私にとってかなり明白な意味合いを持っているようです。 今までにない用語です。:コヒーレントマルチGPU。
CXLは、PCIeプロトコルに関する多くの問題を解決するために設計されたIntelの新しいインターコネクトレイヤであり、Multi-GPUが適切に機能しなくなった主な理由の1つは、コヒーレンシの欠如によるものです。
将来的にはXe GPUが「CXLモード」で動作するようになると思われます。
一言で言えばIntel CXL:PCIe Gen 5以降の規模を拡張するプロセッサー用の異種計算プロトコル
Intelは昨日の「Interconnect Day 2019」イベントで、Compute Express Link(CXL)と呼ばれる、プロセッサ間の相互接続について詳しく説明しました。
これまでデータセンターの相互接続について詳しく説明してきましたが、これは物理的なPCIeポートを介してデバイスを接続するためのものです。
私がPCIeだけでなく物理的なものに言及したのは、インテルCXLは物理的な互換性を保証するために物理的なPCIeポートを介して動作するように設計されているからです。
それは古風な(まもなく)前任者(PCI Express)よりもはるかに将来の裏付けとスケーラブルであるものです。
既存のポート上で大幅な機能アップグレードを実施することは、今日のエコシステムにおいて非常に印象的であり、インテルが主張していることは、単なる小さな機能の向上ではなく、大規模なものです。
第1世代のCXLは、PCIe Gen 5で動作するように設計されているため(まだ数年先です)、PCIe 6までの時間を短縮することが期待されています。
私たちは約8年間PCIe 3を使い続けており、そしてIntelはこの規格のための業界アップグレードサイクルを短縮する準備をしています。
PCIeとCXLプロトコル間の切り替えは完全にシームレスになります。
インテルCXLが従来のPCIeマルチGPU問題をどのように解決するか
インテルが本日発表したCXLに関するプレゼンテーションは、そのすべての中でデータセンターの側面に焦点を当てていましたが、読者ベースにとってはるかに興味深い角度を見ています。
CXLは、CPUとアクセラレータを接着するための究極のスケーリングファブリックとして注目されていますが、それがマルチGPUの最終的に適切な実装を実現するために使用できない理由はありません。
これが私のCXLの取材の中で私が焦点を合わせていることです。
さあ、それを呼び出しましょう:コヒーレントマルチGPU。
PCIeスケーリングの現在の主な問題の1つは、それを介して接続されているすべてのデバイスが、独立したメモリプール、プロセッサ間通信の観点からの高い待ち時間、およびシステム全体にわたる一貫性の欠如を有することです。
これが、NVIDIAやAMDのような企業が歴史的に分割フレームレンダリングやシーケンシャルレンダリングのようなあらゆるマルチGPU技術をソフトウェア面で革新しなければならなかった理由です。
複数のGPUは首尾一貫した全体のようには動作しませんでした - 彼らは独立して行動し、それが示しました。
CXLはそれをすべて解決することを目指しています。
Intel CXLを使用すると、コヒーレントメモリプールを作成でき、レイテンシを1桁短縮できます。
システム全体がまとまりのある全体として機能し、大幅に向上します。 つまり、もしあなたがIntel Xe dGPUを走らせているシステムがあれば、あなたは予備のPCIeスロットに別のものを投入することができ、それはシームレスに拡大するはずです。
CXLが導入するプロトコルは3つあります。
IOプロトコルであるCXL.ioは、検出、設定、レジスタアクセス、割り込みなどのためにPCIeを置き換えます。
それから、CXL.cacheとCXL.memoryがありますが、これらは、私たちが主に関心を持っているものです。
これらのプロトコルは、接続されたデバイスが首尾一貫した方法でメモリとキャッシュにアクセスすることを可能にします。
理論上では、これはCPUがアクセラレータvRAMにアクセスし、アクセラレータがCPUキャッシュにアクセスするように設計されていますが、これらのプロトコルで複数のGPUが互いのメモリバッファにアクセスできない理由はありません。
あなたはVRAMが決して合わないマルチGPUの厄介な制限を知っていますか?
そうですね、CXL.memoryとCXL.cacheを組み合わせることでそれを解決できるはずです。
Intelはまた、他のインターコネクトとは異なり、CXLは低レイテンシ用に設計されていると述べています。
これはマルチGPUアプローチに最適です。
CXLを介してタイミングを実装できるかどうか、またはSLIブリッジのような「同期」接続が依然として必要かどうかは現時点では不明です。
IntelのCXLプロトコルは非対称でもあるため、システムはアクセラレータ(read:GPU)を受け入れるだけでなく、一貫性のないメモリバッファやプロトコルの動作不能も可能になります。
それだけでなく、これは非常にオープンな規格です。
Intel以外のプロセッサがこのプロトコルを採用することを可能にします。
Intelがこのプロトコルを広めたいのであれば、これが鍵となります。
CXLプロトコルのコヒーレンシバイアスは、従来のプロトコルとは異なり、問題のGPUがメモリにアクセスしている間プロセッサで停止する必要がないことを意味します。
もちろん、GPUはちょっとさておき、このアプローチは主にデータセンター構成のためにピッチされているのでマルチソケットセットアップとCCIXはこれが最初から目標にしているものです。
そのため、ホストバイアスフローもあります。
つまり、必要に応じて、古いフローを使用することもできます。
基本的に、Intelは、CPU、GPU、アクセラレータ、FPGA、およびPCIeポートに接続できるほとんどすべてのものを、一纏まりにできる、異質なコンピューティングインフラストラクチャを作成しようとしています。
未来:CXLモードのIntel Xe GPU?
IntelはXe GPUの野心の詳細についてかなり窮屈に思っている。
私たちが知っているのはそれがスケーラブルになるということだけです。
マルチGPUが何らかの形で関わってくることは、かなり良いことです。
CXLまたはMCM実装、あるいはその両方を介して GPU用のCXLモードが私たちのような愛好家のために主流の消費者セグメントに到達するかどうかは誰もが予想できます - しかし、それが当初マルチGPU設定を実行不可能にした多くの問題を解決します。
GPUからCPUへのデータの流れを制御するソフトウェアスタックやプロトコルに技術革新が起きてから長い時間が経っていますが、この流れが主流の消費者レベルに波及するのを見るのは素晴らしいことです。
Intelが単体のXe GPUを発売した場合、CXLモードはAMDやNVIDIAのハイエンドモデルと競合することを可能にし、その過程で完全に最重要なポイントを変えることができます。
CXLがGPUをシームレスに拡張できると、市場の経済性も完全に変化します。
人々は最初に安価なGPUを購入し、それから彼らがより多くの処理能力が欲しいならさらに別のものを追加することができるでしょう。
それは、購入決定にはるかに柔軟性を追加し、さらには購入者がゲームデバイスに対してある程度、後悔するのを軽減することさえあります。
CXLモードが近いうちに消費者レベルになると、複数のソケットと複数のGPUが実現可能な選択肢になるにつれて、マザーボードの設計が劇的に変化することさえあります。
言うまでもなく、それは物事が数年以内にかなり劇的に変化するように見えます。
ソース:wccftech - Intel Hints Towards An Xe ‘Coherent Multi-GPU’ Future With CXL Interconnect
解説:
何やら難しい話をしていますが、わかりやすくまとめると
intelがサーバー向けに出したCXLという規格を使うとマルチGPUを実現できるという話です。
これだと単純にCorssFireやSLiと何ら変わらないのですが、違うところは、
・PCI Expressと物理的に全く同じ形状であること
・GPUをシームレスに拡張可能ということ
この二点です。
シームレスに拡張可能というのは二枚のGPUをあたかも一枚のGPUのように動作させることが可能になるということです。
マルチGPUとはソフト側の対応が必須でしたが、このCXLという仕組みを使えばソフト側で対応していなくてもそれが可能になり、さらにPCI Expressと同じ形状なので、SLIブリッジのように別途接続する必要もないということです。
ただし、このマルチGPUに関しては、完全に元記事の筆者の予測で、単純にサーバー向けに出された規格を「このようにも使える」と主張しているだけのようです。
このCXLはPCI Express5.0の拡張という形をとっており、PCI Express6までのつなぎとしてPCI Epxress5.5のようなイメージになるようです。
今のところ、今年ようやくPCI Express4.0が出るところですので、いずれにしても数年先の話ということになります。
PCI Express3.0は8年続きました。そういうスケールで考えてもらって差し支えないと思います。
intelはこんな風に地道に周辺の規格や技術を積み上げており、これがintelの強さの秘密の一つでもあります。
今は流れがAMD(ARM勢)に向いていますが、絶対にARMが勝つとは言い切れないのはintelの業界の土台を作っているというこういう強さがあるからです。