パッケージ能力の不足が原因だ。
TSMCの会長は、人工知能(AI)およびハイパフォーマンス・コンピューティング(HPC)アプリケーション向けのコンピュートGPUの供給不足が続いているのは、同社のチップ・オン・ウェーハ・オン・サブストレート(CoWoS)パッケージング能力の制約が原因であることを認めた。
この不足は、ジェネレーティブAIアプリケーションに対する需要の高まりと、TSMCにおけるCoWoS能力の拡張が比較的遅れていることから、18カ月程度続くと予想される。
TSMCのマーク・リウ会長はセミコン台湾での日経とのインタビューで、「AIチップの不足ではなく、当社のCoWoS能力の不足だ。現在、われわれは顧客のニーズを100%満たすことはできないが、約80%をサポートしようとしている。これは一時的な現象だと考えている。先端チップ・パッケージング能力の)拡張後、1年半で緩和されるはずだ。」
TSMCは、ChatGPTのようなAIツールに不可欠で、AIデータセンターで主に使用されているNvidiaのA100およびH100コンピュートGPUを含む、AIプロセッサの大半を製造している。
これらのプロセッサーは、AMD、AWS、グーグルなどの他の企業のソリューションと同様に、HBMメモリー(広帯域幅と広範なAI言語モデルの適切な機能に不可欠)とCoWoSパッケージングを使用しており、TSMCの高度なパッケージング設備にさらなる負担をかけている。
劉氏によると、CoWoSの需要は今年初めに予想外に急増し、前年比で3倍になったため、現在の供給制約につながったという。
TSMCは、ジェネレーティブAIサービスの需要が伸びており、適切なハードウェアの需要も伸びていることを認識しているため、コンピュートGPUだけでなく、特殊なAIアクセラレータやプロセッサの需要にも対応できるよう、CoWoSの能力拡張を加速させている。
現在、同社は既存の先端パッケージング施設にCoWoS用の追加ツールを設置しているが、これには時間がかかり、同社は2024年末までにCoWoS能力が倍増すると見込んでいる。
さらにTSMCは最近、先端チップ・パッケージング専用の新施設に29億ドルを投資する意向を発表した。
台湾の苗栗近郊に位置するこの施設は、あらゆる部門からの先端パッケージング需要に対応するというTSMCのコミットメントと、今後の半導体業界における先端チップパッケージングの重要性を認識していることの証である。
先端チップパッケージングへのこのような注力はTSMCに限ったことではなく、インテルやサムスンのような他の業界大手も優先的に取り組んでおり、インテルは2025年までに最高級チップパッケージングの生産能力を4倍にすることを目指している。
ASEやAmkorのような従来の半導体組立テスト(OSAT)アウトソーシング企業もCoWoSと同様の技術を有しているが、TSMC、インテル、サムスンに匹敵する生産能力を構築するには至っていない。
ソース:Tom's Hardware - TSMC: Shortage of Nvidia's AI GPUs to Persist for 1.5 Years
解説:
TSMCの生産能力の問題でnVIDIAのAI/MLチップ不足は1年半は解消しない
Ada Lovelaceの売り上げが苦戦していると伝えられているnVIDIAですが、ゲーム市場とは裏腹にAI/ML関連では絶好調のようです。
サブストレート不足の次はパッケージ製造能力の不足と次々と問題が出てきていますが、生成AIの需要が3倍になっているのも原因の一つなのでしょう。
生成AIはマイニングと違って突然需要が0になることはありませんので、安定しているほか、TCOの関係でお行儀悪くゲーミングGPUから店頭に並ぶ前に横からかすめ取っていくということもありません。
人気はnVIDIAのA100やH100に集中しています。
別の記事にもありましたが、他社にもAI/ML関連製品はありますが、顧客はnVIDIAの製品を好むということですね。
ずっとAI/ML関連の製品を出し続け、周辺環境もnVIDIA製品に合わせて作られていますから、他社が入り込むのはかなり難しいのでしょう。
当サイトでもずっとROCmのセットアップスクリプトを配布しています。
少しでもRadeonでAI/ML環境を構築してくれる人が増えてくれたらうれしいですね。
今や生成AIの市場はnVIDIA一色となっています。
この状況はしばらく続くのでしょう。
TSMCに対する需要もしばらくは続くのでしょう。