AMD ROCmのサポートがLinuxからWindowsに拡大する可能性があり、ユーザーと開発者に大きな利益をもたらすかもしれない。
AMDのAIソフトウェア担当副社長、WindowsでのROCmサポート要請に対して肯定的な回答
WindowsでのROCmサポートの要望は何年もAMDに保留されており、ユーザー、特に開発者はAMDの動きを待ち望んでいた。
数年前、AMDはWindowsにROCmサポートを提供すると約束したが、AMDがバージョン5.5.1からWindows 10と11でROCmサポートを提供したことを除いて、その進展についてはあまり聞いていない。
現在サポートされているバージョンは6.2.4ですが、これはすべてのRadeon GPUで広くサポートされているわけではなく、ごく一部のファミリーの一部のモデルでのみサポートされています。
これには、AMD Instinct GPUやRadeon RX 7900 XTおよびXTXなどの一部のRadeon GPUが含まれます。
つまり、Radeon GPUを搭載するすべての人がWindows上でROCmを実行できるわけではなく、Radeon RX 9000 GPUはまだサポートされていません。
Yes
— Anush Elangovan (@AnushElangovan) March 7, 2025
ありがたいことに、AMDのAIソフトウェア部門担当副社長であるAnush Elangovan氏は、より多くのGPUでROCmサポートをWindowsにも提供することを肯定的に回答した。
彼は多くを語らなかったが、これはAMDがより多くのRadeon GPUにソフトウェアスタックのサポートを拡張する意欲を示している。
現時点では、WindowsでROCmに対応しているRadeon GPUは数種類しかないが、LinuxではどのRDNA 2 GPUでも簡単に使用できる。
RX 7900 GRE for Windowsより遅いGPUを使用できる場合もありますが、互換性と性能の問題は確実に発生します。
RX 7900 GRE for Windowsが最も安くサポートされているGPUであるため、ROCmが提供する強力なツールを活用できるユーザーは多くありません。
公式にサポートされているGPUであっても、様々なアプリケーションを使用して、クラッシュ、ドライバのタイムアウト、スクリプトのハングアップ、アプリのフリーズが発生する可能性があります。
問題は1つや2つに限定されるものではなく、数多くあり、時にはかなり複雑になることもあります。
AMDがこれらの問題をすべて解決し、WindowsでのROCmのサポートを改善すれば、古いGPUの所有者がディープラーニングタスクを実行できるだけでなく、最新のRDNA 4 GPUをサポートすることで、Windows OSのユーザーや開発者がサポートの改善を通じて活用できる可能性が多くなる。
ROCmがWindowsで完全にサポートされるようになるには、特にAMDがそれについて多くを発表していない現状では、まだかなりの時間がかかるかもしれない。
TinyCorpはAMDスタックを完全にソフビ化しています。つまり、ハードウェアからPyTorchまでのフルスタックを(LLVMを除いて)書き換えていて、もうすぐそれをMI300Xに移植する予定です。tinygradにはtorchフロントエンドがあるので、tinygradを使う必要はありません。
NVIDIAが超過大評価されているか、AMDが過小評価されているかのどちらかだ。ペタフロップがコモディティ化(tiny corpの使命)すれば、現在の状況は意味をなさない。ハードウェアは類似しており、AMDはRDNA4で2倍の処理能力を持つテンソルコアさえ手に入れた(NVIDIAは自社のカードでこれを人為的に半減させているが、すぐに市場の圧力でそうせざるを得なくなるだろう)。
私はAMDが過小評価されていることに賭けており、AIの需要はまだ始まったばかりだと考えている。良いソフトウェアがあれば、MI300XはH100を上回るはずだ。
その他のニュースとして、タイニーグラッドはAMDから直接MI300Xを2台受け取る予定である。
AMD 💕 @__tinygrad__
we are looking forward to working closely with @__tinygrad__ to help commoditize the petaflophttps://t.co/LEjsUaPWHV
— Anush Elangovan (@AnushElangovan) March 7, 2025
この開発者は、もしAMDがソフトウェア部分に釘を刺すことができれば、NVIDIAがAMDの16倍の価値を持つ理由はないはずだと述べている。
解説:
ROCmがWindowsに移植される可能性。
すでにHIP SDKという形でCUDAの命令を翻訳する仕組みはWindowsに移植されているのですが、残念ながらPytorchやTensorFlowといった機械学習用のフレームワークは動作しません。
きわめて趣味的な話をすればこれが動かないとStable Diffusion WebUIやText-generation-webui、MusicGen+WebUIのようなローカル生成AIは使用できません。
ROCmがWindowsに移植されればほとんどのWebUIはRadeonで実行できるようになります。
ZLUDAもありますが、アプリケーションキャッシュが必要なこと、cuDNNに対応していないためソースの改変が必要になることがあって手軽とはいいがたい状況です。
ZLUDAは現状Geforce用のフレームワークをHIPで処理するためのWrapperのように動作しています。
ほとんどの場合、ROCmには対応してくれているので、ROCmが移植されれば意識することなく、Geforceのような感覚でRadeonでローカル生成AIのWebUIを簡単に楽しむことができます。
おそらくは、StabilityMatrixも対応すると思いますので、そうなるとわたくしが個人で出しているセットアップスクリプトもお役御免でしょう。
公式がWindowsネイティブの対応を保証してくれるのは大きいです。
ぜひとも早期に対応していただきたいところ。
Flash Attention V2やMIgraphXもRadeon上で動作するようになるのではないかと思います。
現時点ではAMDの公式はWSL2からROCmで生成AIを動作させる方法を提供していますが、WSL2の実態は仮想PCですから、ゲストOSを動かすパワーとメモリを無駄に使っているということになります。
メモリを大量に消費する生成AIでこれはちょっと厳しいです。
ネイティブだと32GBくらいあれば十分動作しますが、WSL2だと64GBくらいはあったほうが良いと思います。
ただし、今から開発するんであれば、出るのは相当先ということになると思います。
1年以内に出たら御の字って感じではないでしょうか。
AMDがWindows版ROCmを出してくれれば、個人向けホビー生成AI向け分野の現実的な選択肢として、Radeonが入ってくるということになると思います。
例えば、Radeon Pro W7900などはNavi31を使用し、48GBものメモリを搭載しているにも関わらず、価格が66万円台で販売されています。
つまり、RTX5090の1.5倍のメモリを搭載しているのにもかかわらず、ほとんど同じ価格で入手できるということです。
もちろん、速度は圧倒的にRTX5090に劣ります。
しかし、ボード側のGDDRメモリが枯渇したらどれほど動作が遅くなるのかを痛感している方も多いと思いますので、魅力的な選択肢として映る方も多いのではないでしょうか?
Radeonというライバルが現れれば、Gefroceも価格を下げるかもしれませんし、生成AI用途でどれほどコスパが改善されるかその恩恵は測り知れないと思います。
Windows版ROCmがリリースされれば、個人向け生成AI用途での革命が起きると思います。
AMDのGPU Radeonシリーズ
Radeon 7000シリーズ
Radeon RX 6000シリーズ
※ SAPPHIREはAMD Radeon専業のメーカーであり、Radeonのリファレンス的なメーカーです。