その他

マイクロソフトは、NVIDIAのCUDAによる支配を打破するために「ツールキット」を開発し、AMD製AI GPUを使用して推論コストを大幅に削減したと報じられている。

投稿日:

マイクロソフトは、推論ワークロード向けにAMD製GPUの「スタック」を活用する方法を模索しており、NVIDIA CUDAモデルをROCm対応コードに変換するツールキットを開発しています。

マイクロソフトはトレーニングよりも推論に対する需要がはるかに大きいと見ており、それがAMDのAIチップをより魅力的なものにしています。

NVIDIAがAI分野で優位性を維持してきた理由の一つは、同社が「CUDAロックイン」という仕組みを構築していることです。

これは、クラウドサービスプロバイダーやAI大手企業がNVIDIAのCUDAソフトウェアエコシステムで最適な結果を得るために、NVIDIAのAIチップを使用せざるを得ないようにするものです。

これまでにもこの障壁を打破し、クロスプラットフォーム対応を実現しようとする試みはありましたが、主流となるソリューションは登場していません。

しかし、マイクロソフトの「上級幹部」によると、同社はCUDAコードをROCm互換バージョンに変換することで、AMD製GPU上でCUDAコードを実行できる「ツールキット」を開発したと報じられています。

CUDAの優位性を覆すのは容易なことではありません。ソフトウェアエコシステムはAI業界にとって非常に重要であり、中国のような国でもその普及率はほぼ100%に近いからです。

しかし、従業員が言及したマイクロソフトのツールキットは、おそらく以前から市場に存在していたアプローチを採用していると考えられます。

CUDAからROCmへの変換方法の一つは、ランタイム互換性レイヤーを用いることです。

これにより、ソースコード全体を書き換えることなく、CUDA API呼び出しをROCmに変換できます。

その一例がZLUDAツールです。このツールはCUDA呼び出しをインターセプトし、ROCmに変換しますが、完全な再コンパイルは必要ありません。

「私たちは、CUDAモデルをROCmに変換して、AMDの300XのようなGPUで使用できるようにするためのツールキットをいくつか開発しました。AMDの400Xや450Xに関する今後の展開について、多くのお問い合わせをいただいています。現在、AMDと協力して、これらのGPUを最大限に活用する方法を検討しています。」

しかし、ROCmはまだ比較的新しいソフトウェアスタックであるため、CUDAにはAMDのソフトウェアに対応するAPIコールやコードが存在しない部分がいくつかあり、場合によってはパフォーマンスが著しく低下する可能性があります。

これは大規模なデータセンター環境においては大きなリスクとなります。

ここで言及されているツールキットのもう一つの可能​​性としては、Azureと統合し、AMDとNVIDIAの両方のインスタンスを対象としたエンドツーエンドのクラウド移行ツールが考えられます。

もちろん、大規模な変換を行う際には問題が発生する可能性もありますが、マイクロソフトが開発しているツールキットは限定的な用途にとどまっているようです。

マイクロソフトがここで「ソフトウェア変換」に取り組んでいる理由は、推論ワークロードが増加しているためであり、よりコスト効率の高いワークロードを求めているからです。

そのため、高価なNVIDIA GPUの唯一の代替となるAMDのAIチップが注目されているのです。

そして、推論環境においてCUDAモデルを無視することはできないため、CUDAからROCmへの変換はマイクロソフトにとって次の大きなステップとなるでしょう。

ソース:wccftech - Microsoft Has Reportedly Developed “Toolkits” to Break NVIDIA’s CUDA Dominance, Slashing Inference Costs with AMD AI GPUs

 

 

 

解説:

さて、マイクロソフトがAMDのROCm向けにソフトウェアの変換ツールキットを開発したようです。

ROCmの中核をなし、CUDA向けのプラグラムを翻訳する仕組みをHIPといいますが、このHIPがあるため、ほとんどソースを変更せずにCUDA向けのプログラムをそのままコンパイルすることができます。

HIPのみならず周辺のライブラリも互換性のあるライブラリを開発しており、これはROCmに含まれています。

例えばcuDNN=MIOpenといった具合です。

マイクロソフトがCUDA向けのプラグラムを自動でROCm向けに直すツールキットを開発したようです。

ROCmでプログラムを実行した人ならわかる通り、残念ながら、ROCmを用いてもCUDAと同じ結果を出すことはできません。

一部の命令はROCmでは実行できずにCPUで実行することもありますのでね一対一でCUDAの命令がROCmで実行できるわけではないからです。

また、使ったことがある方ならわかると思いますが、CUDAでStable Diffusion WebUIでメモリを節約する設定やテクニックはROCmでは使えません。

メモリの使用量や最適な設定そのものが違うからです。

このような事情により、ROCmはCUDAと等価ではありません。

しかし、NVIDIA製GPUの高コスト体質に音を上げた様々なAI企業がこうしたROCmのためのツールキットに注目をしていることでしょう。

AMDの中でもROCmは最重要製品の一つですから、バージョンを重ねるごとに完成度が上がっています。。

ROCm7.xからWindowsにも対応する予定ですし、ROCm独自の機能を使ってNVIDIAより高速に実行したり、独自の最適化ノウハウが確立するかもしれません。

そういった下地が出来つつあるところだと思います。

このマイクロソフト製ツールキットもそうした動きの中の一つでしょう。

 

-その他
-

Copyright© 自作ユーザーが解説するゲーミングPCガイド , 2026 All Rights Reserved.