IntelはPonte Vecchio GPUの展開を終了し、技術的驚異とされたチップの終焉を告げた。
IntelのPonte Vecchio GPUは、そのチップレットを多用する設計に関して技術的な驚異だったが、ブルー・チームは今移動している!
IntelのPonte Vecchio GPUは2019年に初めて公開され、Intelの元GPUグル(導師)であるRaja Koduriの発案だった。
発表当時、このチップは次世代エクサスケール・コンピューティング・プラットフォームを動かすために設計されたが、同社は1つのパッケージに複数のチップレットを収めたこの驚異的なチップを作るためにいくつかのハードルを越えなければならなかった。
参考までに、IntelのPonte Vecchio GPUは、1つのパッケージに合計47個のタイルを搭載していた:
- 16 Xe HPC(内部/外部)
- 8 Rambo(内部)
- 2 Xeベース(内部)
- 11 EMIB(内部)
- 2 Xeリンク(外部)
- 8 HBM(外部)
Ponte Vecchio GPUは、Intel・データセンター・マックスGPUシリーズに採用され、このエクサスケール・チップ・プラットフォームを搭載した代表的な製品のひとつがオーロラ・スーパーコンピュータだった。
AMDを搭載したフロンティア・スーパーコンピューターは、エクサスケール競争でIntel搭載のオーロラを打ち負かしただけでなく、現在1位の座にあり、ピーク効率もPonte Vecchio 搭載システムより高い。
Intelは、専用のAIアクセラレーターを搭載したXeハードウェアのおかげで、AuroraスーパーコンピューターでAI性能の記録を塗り替えることに成功したが、同社は現在、Gaudiアクセラレーターに重点を移しており、Gaudi 2とGaudi 3がこのセグメントに対応する主要チップとなっている。
ServerTheHomeの取材に対し、IntelはPonte Vecchio GPUを搭載したクラスタを今後展開しないことを明らかにした。
同社は、既存のクラスタにPonte Vecchioを提供し続けるが、新しいクラスタは作らない。
Ponte Vecchio GPUのHPC能力を活用することに興味がある人々にとって、それらは引き続きIntel Developer Cloudで利用可能だが、同社は現在、次世代のFalcon Shores GPUに注目していることを再確認した。
先週の時点で、Intel・Ponte Vecchio は新たな段階に移行している。新しいクラスターを探すのではなく、既存のクラスターに充填して販売し続けるつもりだ。同様に、Intel Xeアーキテクチャは同社にとって重要なものであるため、IntelはFalcon Shores(できれば来年)に向けて、Intel Xeの背後にあるソフトウェアの開発をまだ続けるつもりだ。
ServerTheHomeより
Intelはまた、Ponte Vecchio GPUのアップグレード版であるリアルト・ブリッジを発表する予定だったが、これは後に中止された。Falcon Shoresは当初、x86 CPUとGPUを組み合わせたアーキテクチャになる予定だったが、GPUのみの設計に変更された。
この設計は、CDNA 3 GPUとZen 4 CPUコアを1つのパッケージに統合したAMD MI300A APUアクセラレーターに似ている。
我々が知る限りでは、Intel・Falcon Shores GPUは、Gaudiと次世代Xe GPUアーキテクチャの両方の長所を利用し、それらを1つのパッケージに統合する。このGPUは来年発売される予定だが、製品が実際に予定通りに出荷されるのか、それともその前に発売されたPonte Vecchioと同じような遅れに直面することになるのか、見守る必要がある。
解説:
Ponte Vecchioが終了し、 Falcon Shoresへ移行。
これで元AMDのRadeon開発チームを率いたラジャ氏がIntelで行ったラインがまた一つ消えてしまいました。
Falcon Shoresは当初MI300AのようにAPU形式だったようですが、現在はGPUのみになっています。
元記事を見るとGaudiとXeの中間のラインと書いてありますが、当初はAPUラインとして立ち上がって、のちにPonte Vecchioの後継になったという理解でよいのだと思います。
実際のところ、Gaudiに関しては欧米のメディアでも評判があまり聞こえてきていません。
現時点ではAMDのMi300シリーズのかなり後塵を拝しているようですね。
NVIDIAとAMDとIntelのAI/MLアクセラレーターの割合は1:1/11:1/80らしいですから、AMDにもかなり遅れを取っているということになります。
Intelの作る仕組みはかなり大がかりですから、浸透するのに時間がかかるのと、ハードウェアの立ち上げに苦戦しているというところがあるのだと思います。
AMDはROCmでCUDAとの高い互換性を現時点で実現していますが、OneAPIなどの仕組みが一度浸透すればIntelと協業連合のほうが将来性はあるんだろうなと思います。
NVIDIAも脅威に思っているのはどちらかというとIntelの名前を挙げていました。
このあたりAMDにももう少し頑張ってほしいところです。
ソフトウェアの開発には莫大な時間と金がかかりますが、今後半導体企業の業績のカギを握っているのは間違いなくAI/ML環境だと思います。