■事実
Ascend 950PR:推論特化の新AIチップ
Huaweiの最新AIアクセラレーター「Ascend 950PR」の顧客テストが良好な結果を示し、ByteDanceおよびAlibabaが近く発注する計画であることが、Reutersの報道で明らかになった(https://x.com/YouJiacheng/status/2028791942348427656)。
Huaweiは前世代のフラッグシップチップ「Ascend 910C」を民間の大手テック企業に大規模採用させることに長年苦戦してきた歴史があり、今回の報道は同社にとって大きな転換点となる。
中国政府による国産半導体の採用促進キャンペーンがあったにもかかわらず、Ascend 910Cの民間大手への普及は限定的にとどまっていた。
Reutersの関係者情報によれば、Ascend 910Cと比べて950PRの純粋な演算性能の向上は小幅にとどまるが、推論(インファレンス)ワークロードに特化した設計となっており、応答速度が大幅に改善されているとされる。
Huaweiは2026年中にAscend 950PRを75万枚出荷する計画を立てており、1月から顧客向けのサンプル配布を開始、量産は4月に開始され、本格出荷は2026年後半を予定している。
価格はDDRメモリ搭載の標準版が約5万元(約690万円)、高速HBMメモリ搭載のプレミアム版が約7万元となっている。
ByteDanceは2026年にHuaweiのAscendチップに56億ドル以上を投じる計画とも報じられており、前年比で大幅な拡大となる見通しだ。
主要スペックとロードマップ
演算性能はFP8で1 PFLOPS、FP4で2 PFLOPSをサポートする。
インターコネクト帯域幅は2 TB/sを実現し、Huaweiが独自開発した「HiBL 1.0」と称する自社製HBMを初めて搭載する。
HiBL 1.0は128GBの容量と1.6 TB/sの帯域幅を持ち、自社製HBMの採用により製造サプライチェーンの制約から独立した量産体制の構築を狙う。
Huaweiは昨年9月の中長期半導体ロードマップ公開で、2026年内に950DT、2027年末に960、2028年末に970を順次投入する計画を示しており、毎年ほぼ倍増のペースで性能向上を目指している。
なお、外部のアナリスト分析(外交問題評議会など)によれば、現行の950PRシリーズは前世代の910Cと比べて演算性能が向上しておらず、Huaweiの製造能力に制約がある可能性も指摘されている。
CUDAの壁を崩すCANN Next
今回の最大の注目点は、チップ自体のスペックよりもソフトウェアスタック「CANN Next」の大規模アップグレードにある。
CANN(Compute Architecture for Neural Networks)はHuaweiが独自開発したAI計算フレームワークだが、NVIDIAのCUDAエコシステムとの非互換性が、民間テック企業による大規模採用を阻む最大の障壁となっていた。
CANN Nextでは、SIMTプログラミングモデルを新たに採用し、スレッドブロック・ワープ・カーネルローンチといったCUDAの主要コンセプトに相当する機能を実装している。
狙いは翻訳レイヤーや互換レイヤーの提供ではなく、開発者がCUDAで書いているような感覚でコードを記述できる「ドロップイン代替」の実現だ。
CUDAを一種の言語標準として扱いながら、実際の実行はAscendシリコン向けに最適化されるという設計思想で、スレッド数やブロックサイズなどのパラメーターはHuawei独自チップ向けにチューニングされている。
Reutersの関係者も「新チップがNVIDIAのCUDAソフトウェアシステムとより互換性が高く、応答速度も向上したことで各社が満足している」と明言している。
CUDAエコシステムの壁とこれまでの経緯
NVIDIAのCUDA(Compute Unified Device Architecture)は2006年に登場して以来、約20年にわたってAI・GPU計算の業界標準として君臨してきた。
PyTorch、TensorFlow、JAXをはじめとする主要なAIフレームワークはすべてCUDAを前提に設計されており、企業や研究機関が蓄積してきた開発資産・最適化ノウハウの多くがCUDAに依存している。
HuaweiのCANNは当初、独自のプログラミングモデルとして開発されたが、CUDAとの互換性の低さがAscendシリーズの採用障壁となってきた。
CANNは2025年にオープンソース化されており、これにより中国国内の開発者がAscendチップ向けにAIワークロードを最適化するエコシステムが徐々に形成されてきた経緯がある。
CANN Nextはこの流れを加速させるべく、CUDAの開発体験そのものを再現することを目指した、より踏み込んだアップグレードとなっている。
SemiAnalysisのアナリスト、ディラン・パテルは「CUDAのモートは実在するが、縮小しつつある」と指摘しており、長期的にはCUDA依存の低下が進む可能性を示唆している。
中国のAIチップを取り巻く地政学的背景
Ascend 950PRのタイミングは、中国市場におけるNVIDIAの苦境と重なる。
米国の輸出規制により、NVIDIAのH100・H20など主要AIチップは中国への輸出が制限または禁止されており、NVIDIAのジェンスン・フアンCEOは同社の中国AIチップ市場シェアが事実上ゼロになったと発言している。
トランプ政権はH200の対中輸出を条件付きで解禁したものの、中国当局による輸入承認の見通しは依然として不透明であり、実際の普及時期は確定していない。
この供給真空を埋めるべく中国の主要テック企業が国産チップへの移行を余儀なくされている状況の中で、Ascend 950PRはその主役候補として浮上している。
中国国内のAI推論コンピューティング需要は、モデル開発から実世界への展開へと産業のフォーカスがシフトするにつれて急拡大しており、Ascend 950PRはこの波を取り込む推論特化設計となっている。
中国のAI推論需要の拡大を後押ししている要因の一つに、オープンソースAIエージェント「OpenClaw」の急速な普及がある。
競合として、Cambricon(カムブリコン)、Alibabaの半導体部門T-Head、Baiduが出資するKunlun Techなども独自のCUDA互換AIチップを投入しており、中国国内の競争環境も激化している。
解説
正直なところ、Ascend 950PRで本当に重要なのはチップのスペックではなく、CANN Nextによるソフトウェアの壁の突破だと思っている。
これまでHuaweiのAscendシリーズが民間の大手テック企業に敬遠されてきた最大の理由は、演算性能の差よりもCUDAエコシステムとの非互換性だった。
開発者が積み上げてきたCUDAのコード資産、ライブラリ、ノウハウを全部捨てて乗り換えるコストは非常に大きい。
CANN Nextがやろうとしていることは、その移行コストを限りなくゼロに近づけること——つまり「CUDAっぽく書いてAscendで動く」という体験を作ることだ。
AMDがROCmで長年やろうとして苦労していることと本質的には同じアプローチだが、HuaweiにはByteDanceやAlibabaという事実上の「強制顧客」と国家戦略という強力な後ろ盾がいる点が違う。
CUDAの覇権は「CUDA自体が最高」だから続いているというより、「エコシステムが巨大すぎて乗り換えられない」という惰性で続いている部分が大きい。
ここで「独自技術症候群」という言葉がある。
プライドのある技術者ほど、すでに存在する先行技術を自分が作り出した「より優れた技術」で上書きしたいという欲求を持つ。恐らく技術者であれば誰でも一度は「り患」したことがある病理だろう。
しかし、CUDAのようにすでにトップシェアを持ち、巨大なエコシステムを形成している技術に対してこれを行うのは大きな間違いだ。
少なくともユーザーは誰も望んでいない。
NVIDIAに対抗するには、独自技術症候群から脱却し、可能な限り業界で一つに纏まって協力していく必要がある——ROCm、XeSS、OpenCLなど、非CUDAの技術が乱立するより、標準化に向けて力を合わせるほうがずっと効果的だ。
今回のCANN Nextが実際にどの程度の互換性を実現できているかは、実際にコードを移植してみないとわからない。
「CUDA互換」という言葉は各社が使いたがるが、実際の互換レベルには天と地の差がある。
ただ、ByteDanceとAlibabaが「これで行ける」と判断して発注に踏み切ったという事実は、それなりの完成度があることを示唆している。
個人的に気になるのは製造能力の問題だ。
75万枚という目標数字はかなり野心的で、SMICのDUV(深紫外線)プロセスだけでその量を捌けるのかという疑問が残る。
Ascend 910B・910CはTSMCで製造されていた分がかなり含まれていたとする外部分析もあり、制裁下での自社製HiBL HBM込みの大量生産が本当に計画通り進むかどうかは未知数だ。
NVIDIAにはCUDAという20年の蓄積があり、CANN Nextがそれを一気に追い越すのは現実的ではない。
ただ、「CUDAの完全な代替」でなくとも、「中国市場で十分使えるレベル」であれば目的は達成できる。
地政学的な制約が続く限り、中国のハイパースケーラー(ハイパースケーラー:クラウドサービスを超大規模に展開する企業群)はHuaweiと付き合わざるを得ず、ソフトウェア移行コストを下げた今回の戦略は正しい方向だ。
NVIDIAの中国市場での影響力低下は、Ascend 950PRの性能が十分かどうかよりも、政治的要因に左右されるというのが個人的な見立てだ。
中長期的に見れば、中国はNVIDIAから独立した推論インフラを本気で構築しようとしており、今回のAscend 950PR+CANN Nextはその布石の一つに過ぎない。
中国の場合、国家の後押しを得て強力にその方向を推進できる点が、民間主導で進めるAMDやIntelとの決定的な違いだ。
AMDがROCm整備に何年もかけてきたことを思えば、Huaweiの前途も簡単ではないが、「独自技術の押しつけ」から「CUDA互換の実現」へと戦略を転換した今回の方向性は正しい。
ソフトウェアで勝負する——その答えにたどり着くのに、随分と時間がかかったものだ。
一点補足すると、今回の推論需要拡大の背景として挙げられているOpenClawについては、オープンソースAIエージェントとしてのセキュリティ面での評価が別途必要であり、利用を検討する際は十分な検証を行うことを推奨する。