自作PCユーザーがゲーム用PCの解説をします

自作ユーザーが解説するゲーミングPCガイド

Claude Codeがわずか30分でNVIDIAのCUDAをROCmに移植、「CUDAの堀」崩壊の兆しか

投稿日:

※ 画像は記事の内容をもとにしたイメージです。

 

AIエージェントプラットフォームのClaude Codeが、NVIDIAのCUDAコードをAMDのROCmプラットフォームに移植する作業をわずか30分で完了させたという報告が話題を呼んでいる。あるRedditユーザーがClaude Codeを使用してCUDAバックエンド全体をROCmに移植したと報告し、これがNVIDIAの「CUDAの堀」を突き崩す可能性があると議論されている。

■Claude Codeによる移植の実際

Redditユーザーのjohnnytshiによれば、Claude Codeを使用してCUDAバックエンド全体をAMDのROCmに移植するのにかかった時間はわずか30分で、しかも翻訳レイヤーを介さない直接的な移植だったという。ユーザーが直面した唯一の問題は「データレイアウト」の違いだけだった。

Claude Codeはエージェント的なフレームワークで動作する。つまり、単純にCUDAのキーワードをROCmのものに置き換えるだけでなく、特定のカーネルの基礎となるロジックが一貫性を保つようにインテリジェントに動作する。もう一つの利点は、Hipifyのような複雑な翻訳環境を設定する必要がなく、CLIから直接移植作業を実行できることだ。

ただし、このRedditユーザーは具体的にどのようなコードベースで作業していたかを明示していない。ROCmは本質的にNVIDIAのCUDAプラットフォームの多くの側面を模倣しているため、単純な移植であればAIにとって複雑な作業ではない可能性がある。本当に興味深いのは、相互に接続された複雑なコードベースを扱う場合で、これにはエージェントシステムが効果的にROCmに移植するために広範なコンテキストが必要となる。

さらに重要なのは、カーネルの記述は「ディープハードウェア最適化」を確実に行うことが全てであるという点だ。特定のキャッシュ階層などに関しては、Claude Codeはまだ不十分である可能性が高いと指摘されている。

■CUDAの堀を突き崩す取り組みの歴史

NVIDIAの「CUDAの堀」を突き崩す試みは数カ月前から進行している。ZLUDAプロジェクトやMicrosoftなどの内部的な取り組みが存在するが、GPU加速性能のためのカーネル記述に関しては、NVIDIAが依然として支配的な存在であり続けている。

CUDAがAI業界において支配的な地位を保っている理由は、その堅牢なソフトウェアエコシステムにある。AMDなどの競合他社は現在、これに匹敵するものを提供できていない。クロスプラットフォームのソフトウェアスタックサポートを可能にする取り組みは行われてきたが、主流となるソリューションはまだ登場していない。

■Microsoftの内部ツールキット開発

2025年11月、Microsoftの上級社員によれば、同社はCUDAコードをAMDのGPUで実行できるようにする「ツールキット」を開発しているという。このツールキットは、CUDAコードをROCm互換バージョンに翻訳することで、Microsoftが自社のAzureデータセンターにおけるAI推論コストを大幅に削減し、NVIDIAへの依存度を下げることを目指している。

MicrosoftがこのツールキットOpenしているのは、AI推論セグメントにおける最大の成長分野を見据えているためだ。推論では、演算あたりのコストがトレーニングよりもはるかに重要になる。AMDのInstinctシリーズは、NVIDIAのHopperやBlackwellアクセラレータと比較して、より有利な性能対価格比を提供している。ソフトウェア互換性により、企業は既存のCUDAモデルを大きなコストをかけて書き直す必要なく、Azure インフラストラクチャを将来的に使用できるようになる。

Microsoftのツールキットは、「ランタイム互換性レイヤー」という手法を採用していると見られている。これは、CUDA APIコールをインターセプトし、ソースコード全体の書き直しを必要とせずにROCmに翻訳するものだ。この手法の一例がZLUDAツールで、CUDAコールをインターセプトしてROCmに翻訳し、完全な再コンパイルを必要としない。

Microsoftの上級社員は次のように述べたとされる。「過去3~4カ月の間に、推論でコストを削減することへの関心が大幅に高まっています。私たちは、CUDAモデルをROCmに変換するのを支援するツールキットをいくつか構築しました。これにより、AMD 300Xのようなチップで使用できるようになります。AMDとの関係、400Xや450Xについて多くの問い合わせを受けています。私たちは実際にAMDと協力して、それを最大限に活用できる方法を検討しています」

■技術的課題と限界

ただし、AMDのROCmはCUDAほど成熟したソフトウェアスタックではない。一部のCUDAコードやAPIコールには、ROCmに直接相当するものが存在せず、これがパフォーマンスの大幅な低下につながる可能性がある。これは大規模なデータセンター環境では非常にリスクの高い領域だ。

変換は二値的なものではない。一部のCUDAカーネルはROCmにうまくマッピングでき、わずかなオーバーヘッドで実行できる。しかし、ベンダー固有の命令、インラインPTX、または高度に調整されたcuBLAS/cuDNN呼び出しを利用するカーネル、特にこれらは再作業が必要となる。

さらに、Microsoftのツールキットはまだ一般向けには提供されていないようだ。これらはMicrosoftの内部Azureサーバー専用であれば、NVIDIAが訴訟を起こすことも困難だと見られている。しかし、NVIDIAのエンタープライズ契約のエンドユーザー使用許諾契約(EULA)は、CUDAを他のプラットフォームに移植することを禁止しているため、法的な問題が存在する可能性がある。

■ZLUDAプロジェクトの教訓

ZLUDAは、AMDのGPU(以前はIntelのGPUもサポート)でのCUDAのドロップイン置き換えで、ほぼネイティブに近いパフォーマンスを提供していた。開発者のAndrzej Janikは、2021年にIntel、2022年にAMDからそれぞれ個別に契約を受けてこのソフトウェアを開発した。しかし、どちらの企業もビジネスユースケースがないとして正式にリリースすることを決定しなかった。

AMDの契約には、JanikがAMD向けのコードを独立してリリースできる条項が含まれていたため、彼はAMDのGPUのみをサポートする新バージョンをリリースすることができた。しかし、AMDは最終的にNVIDIAからの訴訟を恐れてサポートを撤回したと言われている。

■業界への影響とOracleの動き

Oracleの公開声明と報道によれば、同社は2026年後半から約50,000台のAMD Instinct MI450 GPUの初期導入を計画している。これは、多くのワークロードに対してNVIDIAの競争力のある代替手段としてAMDに明確な商業的賭けをしていることを示している。

これらの企業のコミットメントは、ソフトウェア移植性のインセンティブの状況を変える。複数のクラウドサプライヤーが大規模にAMDに移行している場合、堅牢な変換パスは、より低コストの推論を求める多くの顧客にとって市場投入までの時間を短縮する。

MicrosoftがClaude Codeのような堅牢なCUDA→ROCmツールキットを実際に出荷し、Azureのスタックに統合すれば、その効果は即座に現れるだろう。顧客にとってより安価な推論オプション、NVIDIAにとってより緩いソフトウェアの堀、マルチベンダーAIインフラストラクチャへのより速い道が開かれる。

■CUDAエコシステムの現状と課題

CUDAは2007年に設計されたもので、ディープラーニング、ましてや生成AIのはるか以前のものだ。それ以来、GPUは劇的に進化し、Tensor Coresやスパーシティ機能がAIアクセラレーションの中心となっている。CUDAの初期の貢献はGPUプログラミングを容易にすることだったが、TransformerやGenAIのパフォーマンスに必要な最新のGPU機能とともに進化していない。

NVIDIAは2023年までにデータセンターGPU市場シェアの約98%を保持し、AI分野における支配力を確固たるものにしている。CUDAは、NVIDIAの過去と未来の製品を結ぶ橋として機能し、Blackwellのような新しいアーキテクチャの採用を促進し、AIコンピューティングにおけるNVIDIAのリーダーシップを維持している。

しかし、CUDAの支配には独自の永続的な課題がある。最大のハードルの一つは、異なるCUDAバージョンの管理の複雑さで、これは悪夢のようなものになり得る。エンジニアは、CUDAツールキット、NVIDIAドライバー、AIフレームワーク間の互換性を常に確保する必要がある。

■今後の展望

Claude Codeのような AIエージェントプラットフォームの登場は、CUDA移植の障壁を大幅に下げる可能性を示している。ただし、現時点では単純なカーネルの移植には有効かもしれないが、複雑な翻訳にはまだ課題が残っている。

Microsoftのツールキットが確認され、実際に堅牢で本番環境で使用できるものであれば、CUDAのモートに対する真の脅威となる可能性がある。しかし、独立したベンチマーク、ベンダーの確認、本番環境での事例研究が必要であり、CUDAの堀が真に突破されたと宣言する前に、慎重な楽観主義が適切な姿勢だろう。

AI業界は、ハードウェアの選択肢とより低い推論コストに向けた広範な業界的な取り組みを続けている。Claude CodeやMicrosoftのツールキットのような取り組みは、その重要な一歩となる可能性がある。ただし、NVIDIAの強力なソフトウェアエコシステムとハードウェアの優位性は依然として強固であり、真の競争環境が実現するまでにはまだ時間がかかるだろう。