
■事実
NVIDIAのCUDAという壁
開発者はCUDAのエコシステム成熟度ゆえにNVIDIAハードウェアに縛られており、これが競合他社の参入障壁となっています。
中国はこのCUDA依存を国家的リスクと捉えており、対策が急務とされているます。
NVIDIAのジェンセン・フアンCEOは、CUDAを「最強の堀(モート)」と繰り返し表現しています。
これは、CUDAの強さはハードウェアの性能だけでなく、20年以上かけて積み上がったソフトウェアエコシステム(ライブラリ、ツール、開発者コミュニティ)にあるという意味です。
他に知名度の高い同様の例では自作ユーザーにはもうお馴染みのx86が挙げられます。
ウェイ・シャオジュンの提言
中国半導体業界協会(CSIA)傘下のICデザイン部門を率いるウェイ・シャオジュン教授(清華大学)が、CUDAへの依存を「モデル・アーキテクチャ・エコシステムの三重依存」と表現しました。
ウェイ教授は以前から、アジア各国がNVIDIA GPUへ依存するAI開発モデルは長期的に「致命的」になりうると警告していいます。
CUDAの代替エコシステムを構築しようとする翻訳レイヤー方式(ROCmのようなアプローチ)のオーバーヘッドが高すぎると指摘しています。
ウェイ教授はCUDAの直接代替を開発しようとする従来路線に疑問を呈し、異なるアプローチとして「ソフトウェア定義チップ(SDC:Software-Defined Chip)」を提唱しています。
「最初は自社技術が劣っていても使い続けるべきで試行錯誤は失敗するかもしれないが、試みなければ確実に遅れる」と発言しています。
SDCの仕組み
SDCは決定論的コンパイル(deterministic compilation)を採用し、クロックサイクル単位でデータの移動経路を事前に決定・追跡すします。
GPUが実行時に動的スケジューリングを行うのに対し、SDCはコンパイル時に全ての計算グラフをハードウェアに静的マッピングします。
SDCはコンピュートの「知性」をハードウェアの固定レイアウトではなくソフトウェア側に移す設計思想です。
従来のGPUはスケジューラが動的に命令を管理するが、SDCは再構成可能なグリッドを持ち、コンパイラが生成するコンフィギュレーション・ビットストリームで回路を設定する
重要な特徴はコンパイラやコードのソースレベル表現がISA(命令セットアーキテクチャ)に依存しません——これがCUDAとの根本的な違いとなります。
SDCの現実的な困難と既存事例
SDCの実例として挙げられるのはSambaNovaのRDU(Reconfigurable Dataflow Unit)とGroqのLPU(Language Processing Unit)があります。
SambaNova RDUはコンパイラ(SambaFlow)がAIモデルをデータフローグラフに変換し、ハードウェアに直接マッピングし、動的スケジューリングなしに低レイテンシを実現します。
Groq LPUは静的スケジューリングによる決定論的な推論に特化した設計でSRAM依存でメモリ容量に制約があります。
ただし両者とも「特定ワークロード向けの補完」にとどまり、GPUを全面的に置き換えるには至っていません。
SDCの実装はコンパイラへの高い依存度、ルーティング・分岐処理の問題、従来のハードウェア設計規範を覆す構造的変更が必要で、「悪夢的な難しさ」を持っています。
中国国内の関連動向
SugonやLenovo、Moore Threadsなど中国企業が連携し、NVIDIAのCUDAに対抗するオープンなAIコンピューティングアーキテクチャを発表する動きもあります。
別の発表でウェイ教授は14nmロジック+18nm DRAMを3Dハイブリッドボンディングで積層する「ソフトウェア定義ニアメモリコンピューティング」アーキテクチャを提唱(2025年11月)しています。
Huaweiも同様の「チップの積層・クラスタリングで先端ノードの劣勢を補う」戦略を掲げており、戦略的方向性が一致します。
解説
CUDAへの対抗策として「CUDA互換レイヤーを作る」路線(AMDのROCm、IntelのoneAPI的アプローチ)は、長年やってきた各社がいまだCUDAに追いつけていないことが実証済だ。
SDCという発想は技術的に新しいわけではなく、SambaNovaやGroqが既に実装しているが問題は「なぜそれがCUDAを置き換えられていないか」ということ。
SambaNovaとGroqが「特定ワークロード向け」で止まっている理由はAIモデルの多様性・進化の速さにコンパイラが追いつきにくく、汎用性に構造的限界があるためだ。
中国がSDC路線に賭けるのは合理的でもあり、というのはCUDAエコシステムに後から参入するより、ゲームのルール自体を変えにいく方が逆転の目がある
ただし、ルール自体を変えるのが最も難しく、SDCが「特定ワークロード限定」から「汎用AIアクセラレータ」に昇格できるかは、今のところ未知数である。
ウェイ教授がSDCを「中国の生存戦略」と位置づけているのは、輸出規制でNVIDIA GPUが入手困難な状況への切実な対応でもあり制約に端を発している。
HuaweiのAscend+CANNがまさにこのSDC思想に近い実装であり、中国国内でのデファクトスタンダードになりつつある。ただしCANN自体の「独自技術症候群」(CUDA非互換)が普及の壁になっているのも事実である。
結局のところ、プラットフォームの強さはエコシステムが決める。SDCアーキテクチャがどれほど優れていても、開発者がその上でコードを書き、モデルを最適化し、ツールが整備されなければ意味がなく、これはCUDAが20年で積み上げてきたものと同じ問題である。
中国がSDCという「ゲームのルールを変える」戦略に舵を切ったことは確かな転換点だが、理論と実装の間にある溝は深く、SambaNovaとGroqが既にその溝に落ちかけているのを見れば、中国がそれを軽やかに越えられるとは、正直まだ思えないところだ。
20年積み上げてきた実績を今から何とかしようとするのには無理があるだろう。
多くのものがCUDAという堀に挑んだが、すべては敗れて行った。
あの天才「ジム・ケラー氏」のテンストレントもいまだにこの堀を超えられずにいる。
中国の立場からすると、AMDのHIPやIntelのSYCLのような互換路線は取れないのだろう
しかし、それでも独自のしかもかなり複雑な仕組みを今からプラットフォームに育てようというのはかなり無理がある。
多くのものがデファクトスタンダードに挑み、そして得た結論は互換路線が正解ということだ。
この実例は枚挙に暇がない。
可能性があるとすれば中国が国家レベルで人材と資金を投入して今からなんとかするということになるのだろうが、厳しい輸入規制をかけても結局中国国内に無理やりNVIDIAのGPUを密輸して無理やり使っている現状を考えると現実的でないように思える。