時間は刻一刻と迫っている。
Nvidiaのデータセンター向けGPU「H20」は、今月からの最新の米国輸出規制に準拠するよう設計されているが、Reutersの報道によると、延期される可能性があるようだ。
Nvidiaの中国専用GPUの製品スタックは、H20なしではやや手薄であり、中国にはその空白を埋められる企業が他にもあるためだ。
H20データセンターGPUは現在、Nvidiaが中国で合法的に販売できる最速のグラフィックスカードだ。
他の2つの適合GPUとともに、今月初め、アメリカの最新の輸出規制が施行されるとほぼ同時に発表された。
上の図は、現在の米国の規制を示しており、何が許可され、何が許可されていないのかが詳細に記されている。
性能密度はほとんど制限されないが、性能(TPPまたは総処理性能として定義される)は厳しく制限される。
最も低い性能密度であっても、中国に出荷されるGPUはA100とほぼ同等のTPPを持つことはできません。
以下は、NvidiaのGPUがチャート上でどのように位置づけられるかを示すものである(ツイート部分を拡大するとフル画像が表示されます)。
AI compute restriction map (UBS)
NVDA pic.twitter.com/opcrCF25aX
— East (@east_cap) November 11, 2023
aこの2つ目の表(クリックすると詳細が表示されます)は、実際に許可されているGPUと許可されていないGPUを示しています。
A100やA800は禁止されており、A30やA40のような下位チップも禁止されている。
RTX 4090もぎりぎりのところでカットに入らず、現在は禁止されている。
H20は、GPU仕様の制限ゾーンに立ち向かい、スイートスポットかもしれないところを突いている。
およそ2,500TPPの評価で、中国で合法的に販売できるNvidiaの最速GPUである。
H20は、L20とL2という他の2つの準拠GPUとともに今年後半に発売されると予想されていた。
しかし、Reutersの報道によると、NvidiaはH20を3月にも延期するとのことだ。
遅延の原因は、サーバーメーカーがH 20で直面している問題であることは明らかで、H20の発売期限がタイトであることを考えれば、それほど驚くことではない。
GPU | HGX H20 | L20 PCle | L2 PCle |
アーキテクチャー | GPU | Hopper | GH100 | Ada Lovelace | AD102 | Ada Lovelace | AD104 |
メモリ | 96 GB HBM3 | 48 GB GDDR6 w/ ECC | 24 GB GDDR6 w/ ECC |
総合処理性能 (FP16/BF16) | 2,368 | 1,912 | 1,544 |
性能密度 | 2.9 | 3.13 | 5.2 |
メモリ帯域幅 | 4.0 TB/s | 864 GB/s | 300 GB/s |
INT8 I FP8 Tensor | 296 I 296 TFLOPS | 239 I 239 TFLOPS | 193 I 193 TFLOPS |
BF16 I FP16 Tensor | 148 I 148 TFLOPS | 119.5 I 119.5 TFLOPS | 96.5 I 96.5 TFLOPS |
TF32 Tensor | 74 TFLOPS | 59.8 TFLOPS | 48.3 TFLOPS |
FP32 | 44 TFLOPS | 59.8 TFLOPS | 24.1 TFLOPS |
FP64 | 1 TFLOPS | N/A | N/A |
RT Core | N/A | Yes | Yes |
MIG | 最大7 MIG | N/A | N/A |
L2 キャッシュ | 60 MB | 96 MB | 36 MB |
メディア エンジン | 7 NVDEC, 7 NVJPEG | 3 NVENC (+AV1), 3 NVDEC, 4 NVJPEG | 2 NVENC (AVI), 4 NVDEC, 4 NVJPEG |
消費電力 | 400 W | 275W | TBD |
フォーム ファクター | 8-way HGX | 2-slot FHFL | 1-slot LP |
インター フェイス | PCIe Gen5 x16: 128 GB/s | PCle Gen4 x16: 64 GB/s | PCle Gen4 x16: 64 GB/s |
NVLink | 900 GB/s | - | - |
サンプル | 2023/11 | 2023/11 | 2023/11 |
製品 | 2023/12 | 2023/12 | 2023/12 |
表面的には、4ヶ月間製品を発売できないことは、バックブレーカーにはならないかもしれない。
もし中国のデータセンターが今すぐNvidiaのGPUを必要とするなら、ロイター通信が遅れはないと言っているL2かL20を買えばいいだけだからだ。
しかし、Nvidiaが中国でH20を発売・販売する時間はそれほど長くないかもしれない。
昨年、NvidiaのA800とH800は、米国の第1次輸出禁止措置に対応するために発売された。
その後、これらのGPUは今年10月に課された規制によって禁止されたため、市場に出回ったのはせいぜい11カ月ということになる。
さらに多くの規制が法律で定められた場合、H20も中国での寿命が短くなる可能性があり、Nvidiaにとって4カ月の遅れは通常よりもはるかに厄介なものとなる。
現在の環境でGPUを提供するNvidiaの能力に対する不安は、おそらくすでに結果をもたらしている。
Nvidiaの最新の中国製GPUが発表される直前、百度は代わりにファーウェイのASICを購入した。
バイドゥは以前、AmpereとHopper GPUを何千個も購入していたが、この方向転換は、Nvidiaの次期グラフィックチップを待つ気がなかったことを示している。
米国の規制が刻々と変化する今日、米国企業が中国で競争するには柔軟性とスピードが求められる。
しかし、プロセッサーは短時間で完成するような製品ではない。
H20の場合、Nvidiaが可能な限り早く出荷しようとした試みはうまくいかなかったようで、その結果、アメリカのハイテク企業は、性能の優位性と中国の顧客の信頼の両方を失うことになるかもしれない。
解説:
nVIDIAが中国規制対応の新GPU H20が来年初頭に発売か?
アメリカの対中貿易規制に対応するGPUとしてA800とH800と言う2つのモデルがラインナップされていたわけですが、さらに厳しくなった10月からの規制のために販売不可能になりましたので、それに対応する製品としてH20を急ピッチで用意していたようです。
しかし、あまりに急すぎて年内の発売が間に合わなかったという話です。
アメリカの規制はTotal Processing PerformanceとPerformance Densityと言う2つの要素で規制するようです。
Total Processing Performanceに関してはFP8/16/32とTensor処理性能をかけて算出する値が4800以下の場合、規制に引っかからないようです。
この値は1年ごとに見直しされるということですから、アメリカの本気のほどが伺えます。
規制の是非
Tom's Hardwareをはじめとしてテック系メディアや経済系のメディアなどでは規制に対する反発が大きく取りざたされています。
しかし、私はここで規制するのは正しいのかなと言う立ち位置です。
中国が領土的野心を取り下げしない限りは規制されて当然かなと思います。
経済関係者と言うのは安全保障上の問題が起きても知らんぷりしますから、周辺地域の安定性を重視するならば、規制は正しいと私は思います。
そもそも、中国経済がこれだけ躍進したのはアメリカの証券市場を通じて莫大なお金を世界中から集めたからで、その一部が核ミサイルや周辺地域を脅かす兵器の配備に使われているのにも関わらず、自社の利益しか考えないような企業なら、社会に必要ないと私は思います。
難しいことはピンとこない人のためにわかりやすく言うと、一旦中国が台湾に侵攻してしまえば、毎日ニュースで流されているウクライナやイスラエルのガザ地区のような混乱が日本でも起きるということです。
中国には国防動員法と言う在外の中国人を強制的に軍属にする法律がありますので、在日の中国人は一瞬で軍属になります。
中国が領有権を主張している台湾の中には日本の八重山列島(与那国島、西表島、石垣島、多良間島、伊良部島、下地島、宮古島)も含まれています。
中国が台湾に侵攻すれば100%日本も巻き込まれるということです。
ほぼ当事者になることは確定しています。
こうした事情から、他人事とは言ってられませんので、中国に強力なサイバー兵器足りえる最新のAI/ML製品を輸出するのには私は反対です。
規制やむなしです。