Huawei、Ascend 950白書を公開——独自HBM「HiZQ 2.0」搭載の950DT、8月にHuawei Cloudへ前倒し投入

■事実（論旨箇条書き）

Ascend 950シリーズの概要と白書公表

HuaweiがAscend 950シリーズの技術白書を公表しました。。Ascend 950は2025年9月の「Huawei Connect 2025」で発表した3カ年ロードマップ（2026年に950→2027年に960→2028年に970）の第1弾製品です。

同シリーズは2モデル体制で、推論Prefill・レコメンド向けのAscend 950PRと、推論デコード・学習向けのAscend 950DT。両者は同一のプロセッサコア（Da Vinciアーキテクチャ改良版）を共有し、メモリシステムのみ異なります。

製造プロセスはSMICのN+3（5nm相当）で、前世代Ascend 910シリーズのN+2（7nm相当）からの進化です。TSMCへのアクセスがない条件下でHuaweiが選択した現実解です。

Huaweiの公式ロードマップは「年1世代、算力2倍」のペース。白書はこれを前世代比で概ね4倍の性能向上として示しています。（比較対象は主にAscend 910シリーズ）

Ascend 950PR（発売済み）

2026年3月21日、「Huawei China Partner Conference 2026」で正式発売。Atlas 350アクセラレーターカードとして出荷しています。

メモリ：独自開発HBM「HiBL 1.0」を搭載し、容量112GB（カード実装値）、帯域1.4 TB/sです。
FP8演算性能：1 PFLOPS、MXFP4：2 PFLOPS（後者はFP4系フォーマットのみ）
消費電力：600W（NVIDIA H20の約1.5倍）
NVIDIA H20との比較（Huawei公称）：FP4精度での演算スループットが約2.8倍。ただしH20はFP4に非対応であり、形式が異なる比較であることに留意が必要
マルチモーダル生成速度：H20比最大60%向上
メモリアクセス粒度：512バイト→128バイトに縮小（メモリアクセス効率として4倍向上）
価格：約$16,000。2026年に75万枚の量産を計画

ByteDanceが56億ドル相当の発注を確約し、（中国国産AIチップとして史上最大の単一調達）Alibaba Cloud・Tencentも発注中です。

Ascend 950DT（前倒し稼働発表）

当初計画では2026年Q4に正式投入。2026年8月にHuawei Cloudへの前倒し稼働を、Huawei Cloud中国担当VP・陳黎（Chen Lin）が「Huawei Cloud 2026 INSPIRE Creatorsイベント」で表明しています。（2026年6月）

メモリ：独自開発HBM第2世代「HiZQ 2.0」。容量144GB、帯域4 TB/s（950PRのHiBL 1.0比で帯域2.5倍）
インターコネクト帯域：2 TB/s（Ascend 910C比2.5倍）
サポート演算フォーマット：FP8・MXFP8・MXFP4・HiF8（Huawei独自フォーマット含む）

DeepSeekのV4.2が最初期の採用候補として取り上げられています。（TrendForce報告）

スペック比較

仕様	Ascend 950PR	Ascend 950DT	NVIDIA H20
メモリ	HiBL 1.0 / 112GB	HiZQ 2.0 / 144GB	HBM3 / 96GB
メモリ帯域	1.4 TB/s	4.0 TB/s	4.0 TB/s
FP8演算	1 PFLOPS	公称値未公表	非対応
FP4演算	2 PFLOPS	公称値未公表	非対応
インターコネクト	2 TB/s	2 TB/s	—
消費電力	600W	非公表	400W
製造プロセス	SMIC N+3（5nm相当）	SMIC N+3（推定）	TSMC 4nm
提供開始	2026年3月	2026年8月（Huawei Cloud）	米国輸出規制対象

Ascend 960・970ロードマップ（参考）

Ascend 960（2027年Q4予定）：メモリ288GB・帯域9.6 TB/s・演算2 PFLOPS FP8 / 4 PFLOPS FP4・インターコネクト2.2 TB/s
Ascend 970（2028年予定）：インターコネクト4 TB/s。具体スペック未公開

目標は2028年末に4 Zeta FLOPS FP4です。（システム規模の累積値）

ソフトウェア・エコシステム

CANNソフトウェアスタックが「CANN Next」へ進化しました。CUDAとの互換性を強化し、NVIDIAからの移行障壁を下げる設計です。

DeepSeek V4（2026年初頭）はAscend 950プラットフォーム上で動作中。Huawei提供の国産AIエコシステムとして実動しています。

Huawei Cloud上での稼働アクセラレーター総数：100,000枚超（自動運転などの実用途に供給中）

解説

「前世代比4倍」の中身を解きほぐすと——Ascend 910Cと950を比べると、演算性能の向上は主にFP8/FP4という低精度フォーマットの導入によるもの。910Cが使っていたFP16演算と直接比較できるわけではなく、「4倍」は精度フォーマットが変わることで得られる数字という側面が大きい。白書の比較軸は慎重に読む必要がある。

HiBL 1.0とHiZQ 2.0の使い分けは、制約の産物としての最適解——Samsung・SK Hynix・MicronのHBMを調達できないHuaweiが、用途を2つに割り切って異なる独自HBMを開発した。HiBL 1.0は帯域より容量コスト優先（Prefill向け）、HiZQ 2.0は帯域優先（Training・Decode向け）。縛りがある中でアーキテクチャを二股にして最適化するやり方は評価できる。

H20比2.8倍という数字の読み方——NVIDIA H20はFP4をサポートしておらず、Huaweiが比較に使ったFP4スループットはH20には存在しない演算モードでの比較。「H20でFP4を動かすとしたら」というシミュレーションでの推計に近い。比較対象の設定が公正かという点は留保が必要だが、推論スループットの実用ベンチマークで「H20よりはるかに速い」という評価は複数の中国大手AI企業のサンプルテストで裏付けられている。

ByteDanceが56億ドルを確約した意味——「国が推奨しているから仕方なく」ではなく「性能が商業利用に耐えることを実証した上で」の発注であることが重要。Alibaba・Tencentも追随。NVIDIA H20が輸出制限で調達しにくい状況だからこそ、Huaweiが実質的な独占サプライヤーになっている側面はあるが、少なくともDeepSeekのV4が実際に動いているという実績がある。

SMICのN+3で75万枚を作れるかが問題——SMIC N+3の歩留まり率は50〜60%と推定されており（TSMC 4nmの80〜90%に対して）、750,000枚の計画達成には相当のウェハ面積が必要。SMICの先端ノード総生産能力の15〜20%をHuawei向けに充てる計算になる。計画通りにいくかは慎重に見ておく必要がある。

NVIDIA H20が輸出禁止になった穴を埋めてしまった——2025年末のH20全面輸出禁止（米政府）以降、中国AI企業の選択肢はAscend 950一択に近い。NVIDIAはH200の限定輸出承認で巻き返しを狙うが、ByteDanceがすでに56億ドルをAscend側に積んでいる。少なくとも2026〜2027年の中国AIインフラはAscendが支配するシナリオが現実的になっている。

自製HBMの地政学的意味——HBMはSamsung・SK Hynix・Micronが3社で世界市場を独占しており、そのすべてが米国の輸出規制の影響を受ける。HuaweiがHiBL・HiZQを実用レベルで出荷できたことは、中国のAIチップが「コンピュートだけでなくメモリも自給自足」できるかもしれないという実証事例になる。

消費電力600Wという欠点は隠れている——H20が400Wに対して600Wは1.5倍の電力コスト。中国のデータセンターが電力コスト最適化を進めている中で、この差は長期的なTCO（総所有コスト）を押し上げる要因になる。性能比が2.8倍なら電力効率は約1.9倍となり、ワークロード単位では勝てるという理屈は成立するが、空調・電源インフラのコストまで考えると単純ではない。

ロードマップの信頼性——950PRは3月に予定通り発売、950DTは前倒し（Q4→8月）。Huaweiが2025年9月に示したロードマップが実行されつつあるという実績は評価すべき。中国半導体のロードマップはスリップするイメージがあったが、制裁という外圧がHuaweiの開発速度を上げたとも読める。

輸出規制でH100もH200も買えなくなったHuaweiが、「じゃあ全部自分で作ります」と言ってHBMまで自製してしまった件、制裁を考えた人は今どんな気持ちだろう。

中国国内に閉じた話ではあるが、「AIチップの完全国産サプライチェーン」が実際に動き始めた2026年という事実は、半導体地政学の歴史的な転換点として記録されることになるかもしれない。