マイクロソフトのサティア・ナデラ最高経営責任者(CEO)は、AMDのAIアクセラレーターInstinct MI300Xを称賛し、市場で最高の「価格対性能」を提供すると述べた。
マイクロソフトのCEO、AMDのMI300XはGPT-4で最高の価格対性能を実現すると発言
Build 2024の基調講演でサティア・ナデラ氏は、同社がAI分野で進めてきた開発について概要を説明し、過去数カ月で急速なスケーラビリティが実現したと主張した。ムーアの法則が2年周期であるのに対し、Neural Scalingの法則は6ヶ月周期であり、ネットワークは能力の倍増を目の当たりにしている。
マイクロソフトのCEOは、このような急速な進歩が可能なのは、AMDとNVIDIAの努力のおかげだと考えている。
AMDとNVIDIAは、アクセラレータやその他の製品構成などのAI製品を通じて、市場に大きく貢献している。サティアは、マイクロソフトはAMDとのパートナーシップに深く関与しており、チーム・レッドのAI GPU「Instinct MI300X」が搭載する価値に関して最良の選択肢であると見ているという。
同氏は、このプラットフォームは “GPT-4推論で最高の価格/性能 “を実現できると述べている。
https://x.com/ryanshrout/status/1792953227841015897?ref_src=twsrc%5Etfw
マイクロソフトのCEOによるこの発言は、AMDの勝利であり、同社の製品を通じてAI市場で躍進するための努力であることは間違いない。
その他にも、専門家たちによって、Instinct MI300XはNVIDIAの代替製品として優れた選択肢であるとする発言がいくつかなされており、市場がわずかにチーム・レッドに傾いていることを示している。
それでも、昨年NVIDIAのHopper世代が目撃したような火花はまだ見られない。
AMDとは別に、サティア・ナデラは、マイクロソフトがエヌビディアのBlackwell B100とGB200スーパーチップのパワーをクライアントに提供する最初のクラウド企業のひとつであることを明らかにした。
これは、AIコンピューティング競争がこれまで以上にアグレッシブになることを示している。
一方、AMDのCEOは最近、アントワープで開催されたITFワールドに出席し、IMECイノベーション賞を受賞するとともに、今後数年間の効率的なAIコンピューティングの将来像を示した。
主なハイライトは、2027年までに100倍のperf/watt向上を達成する見込みであること、そして以下の通りである:
- AIは、コンピュート需要とそれに伴う電力消費を指数関数的に増大させている。モデルのサイズが大きくなるにつれて、それを訓練するために必要なエネルギーも大きくなる。
- 将来的には、電力網や発電所の発電能力による実用的な限界に達するでしょう。
- AIコンピュートに対するこの増大する需要に対応するには、新しいアーキテクチャ、高度なパッケージング、システムレベルのチューニング、ソフトウェアとハードウェアの共同設計など、多岐に渡る全体的なイノベーションと業界の深い協力が必要です。
- AMDは、効率を向上させるには、デバイスやプロセッサー・レベルを超えた最適化が必要であり、システム・レベルの改善、つまり設計への全体的なアプローチが必要であると考えました。
- AMDは、全体的なシステムレベルのアプローチを通じて、ワットあたりのノードレベルの性能を加速させる機会を見出し続けており、2027年の時点で2020年の基準値の100倍を超える目標を掲げています。
以前報告したように、チーム・グリーンは今後数四半期でBlackwellの生産数を大幅に拡大する見込みであり、このことはこれらの製品に対する大きな需要を示している。
そして、AMDの “想定される “MI400ラインアップの登場により、業界は大きな期待を寄せている。
解説:
AMDのMi300がMSの役員によって高く評価される
定期的にこのような話が上がってきます。
MI300シリーズは個人で購入できるものではありません。
よって、わたくしはLinux+ROCm+RX7900XTX環境で判断せざるを得ません。
Stable Diffusion WebUIのパフォーマンスで比較すると、互換性は高いです。
ほぼそのまま動きます。
この辺りはAMDの今までの努力の結果です。
しかし、性能に関して、100%の性能が発揮できているかというとそうではないと思います。
各WebUI側の最適化も進んでいませんし、61TFLOPSのRX7900XTXはRTX4080以上の性能が発揮できるはずですが、RTX4070Ti以下の性能しか発揮しません。
特に生成する画像が大きくなるほど性能の低下が顕著です。
Mi300シリーズでの性能がどのようなものかわかりません。
しかし、少なくともROCm6.0の時点でCUDAとの互換性が100%ということはないですし、あとはハードウェアの力業で速くしていくしかない状況です。
曲がりなりにもある程度の納入実績があるので今後は各AI/MLのプログラムの最適化が進むことを祈るしかないです。
今後、ROCm7.0くらいからオリジナルのCUDAを超えるような機能を実装してほしいところです。
今のところはRadeonでもCUDAの機能が使えるという以上の意味はないです。
ただ、これでもかなり使いやすくなったようです。
私でもセットアップのスクリプトが書けるくらいですし、使えるようになるまではさほど難易度は高くないです。
IntelもOneAPIなどをぶち上げてCUDAにとって代わることを狙ってはいますが、普及しているとはいいがたく、今のところCUDAとの互換性が高く比較的すぐ使えるAMDのROCmか高く評価されているような印象があります。
しかし、AI/MLアクセラレーターの売り上げ比率はNVIDIA:AMD:Intelで1:1/11:1/80であり、売れているといってもNVIDIAの1/11に過ぎないので、存在感を発揮しているとはいいがたい状況であることは忘れないようにしたほうが良いと思います。
RDNA4の対応するころには今以上の性能が発揮できるようになっていることを期待したいですね。