NVIDIAが世界初の1.6nmチップをGTC 2026で初公開か――次世代「Feynman」アーキテクチャの全貌

VIDIAの次世代AIチップのコンセプトイメージ

NVIDIAは2026年3月15日からカリフォルニア州サンノゼで開催するGTC 2026において、次世代AI加速チップ「Feynman」を初めて公開する可能性が浮上している。

韓国メディア「Chosun Biz」が報じたもので、ジェンスン・ファンCEO自身がキーノートで「世界が一度も目にしたことのない技術」を披露すると予告していたことから、その正体がFeynmanである可能性が高まっている。

Feynmanが注目される最大の理由は、TSMCのA16プロセス（1.6nmクラス）を世界で初めて採用する見込みであることだ。

A16はいわゆる「オングストローム時代」への移行を象徴するプロセスノードで、「Super Power Rail（SPR）」と呼ばれるバックサイド電源供給技術を搭載する。

SPRはウェハの裏面に電源配線を移すことで、ロジックセルの密度向上と消費電力効率の大幅改善を実現する技術であり、AI向け巨大チップの旺盛な電力需要に応えるために設計されている。

TSMCはA16の量産開始を2026年後半に計画しており、NVIDIAが初期の高量産（HVM）フェーズにおいて事実上唯一の顧客になるとみられている。

モバイル向けチップメーカーはA16への対応に大規模なアーキテクチャ刷新が必要なため、採用は後回しになる可能性が高いと業界関係者は指摘している。

製造については、NVIDIAがI/Oダイ部分をIntelの18Aまたは14Aプロセスで製造し、EMIBパッケージング技術を活用する可能性も取り沙汰されている。

これはTSMCの歩留まりや生産能力への依存リスクを分散させる目的と見られており、複数の大手テクノロジー企業が同様のアプローチを検討しているとされる。

Feynmanはすでに2025年のGTC 2025でNVIDIAのロードマップに初めて掲載されており、Vera RubinプラットフォームのGPUコア（Vera CPU、HBM4またはHBM5メモリ）と組み合わせたシステムとして構成される可能性がある。

量産開始は2028年ごろを見込んでおり、顧客への出荷は2029〜2030年になると予測されている。

GTC 2026の発表はあくまで概要・アーキテクチャの紹介にとどまるとみられており、Vera Rubin（GB200）がフル生産中に初公開されたときと類似した形式になると予想されている。

Feynmanを巡ってはもう一つ注目すべき情報が浮上している。

AIスタートアップ「Groq」が開発するLPU（Language Processing Unit）をFeynmanパッケージ内に統合する可能性があるという報道だ。

Groqは2016年にGoogleのTPU開発を主導したジョナサン・ロス氏が創業した企業で、推論（インファレンス）に特化した独自チップ「LPU」を開発・展開している。

LPUは従来のGPUとは根本的に異なるアーキテクチャを採用しており、HBMなどの外部メモリに依存せず、チップ上に数百MBのSRAMをメインのウェイト格納領域として直接搭載する設計だ。

これにより、GPUが避けられなかった「メモリウォール」問題——外部メモリへのアクセスのたびに数百ナノ秒規模のレイテンシが発生する課題——を根本から解消している。

LPUのもう一つの特徴は「決定論的実行」と呼ばれるアーキテクチャで、コンパイラがすべての命令とデータの流れを事前にスケジューリングする仕組みだ。

GPUが動的スケジューリングやキャッシュ管理による予測不可能なレイテンシを抱えるのに対し、LPUはトークン生成の速度と遅延を保証できる。

Groqの第2世代LPUはSamsung 4nmプロセスで製造されており、2025年4月にはMetaが公式のLlama API向けにGroqを採用したと伝えられている。

今回の噂では、NVIDIAがこのLPUをFeynmanのパッケージ内にハイブリッドボンディングで統合する可能性が指摘されている。

実装のアプローチはAMDのX3Dプロセッサ——SRAM用チップレットをダイの上に3D積層する技術——に近いものになると推測されている。

LPUがパッケージ統合オプションになれば、AIインファレンス時のレイテンシを飛躍的に削減できる反面、設計と製造の複雑さが大幅に増すとされている。

現時点ではこれらの情報はリーク・推測の域を出ておらず、GTC 2026での正式発表の内容が注目される。

正直なところ、今回の話は「予告」と「噂」が入り混じっていて、どこまで本気で受け止めるべきか少し判断が難しいところですね。

GTC 2026の時点でFeynmanが製品として登場するわけではなく、あくまでアーキテクチャの概要紹介にとどまるでしょう。

量産が2028年で出荷が2029〜2030年ということは、今回の「お披露目」はNVIDIAが自社のロードマップの優位性をアピールするための場、ということです。

個人的にはこの戦略自体はわかりやすいと思っています。

競合がBlackwellやVera Rubinに追いつこうとしている今、「次は1.6nmで我々はもう動いている」と見せることで、顧客をNVIDIAのエコシステムに引き止める効果がある。

Vera RubinがCESで量産突入を発表した直後にFeynmanを出してくる流れは、いかにもNVIDIAらしい畳み掛けです。

TSMC A16の採用に関して言えば、これはAppleが通常担ってきた「最新プロセスの初期顧客」というポジションをNVIDIAが奪ったという点で、業界的には意味のある出来事です。

モバイル勢が対応できないのは、A16のSPRがウェハ裏面への配線移動を必要とするため、既存のアーキテクチャを根本から見直さないと対応できないからで、そこにNVIDIAが滑り込んでいるわけです。

GroqのLPU統合については、話としては面白いのですが、実現可能性については慎重に見た方がいいと思っています。

GPUとLPUは設計思想がまったく違うので、単純にパッケージに乗せればいいという話ではありません。

ただ、AIインファレンスのレイテンシが競争軸になりつつある以上、NVIDIAがGroqのアプローチを何らかの形で取り込もうとすること自体は不思議ではない。

Groqのサービス自体はすでにMetaが採用しているくらい実績があり、決して辺境のスタートアップではないですからね。

要するに、GTC 2026は「Vera Rubinの時代が始まった今、NVIDIAの目線はもうその先にある」というメッセージを市場に送るためのショーになりそうです。

データセンター市場においてNVIDIAへの依存度が高まることへの懸念が高まる中、AMD、Google TPU、Amazon Trainium、Microsoft Maiaなどの追い上げも続いていますが、ロードマップの深さという点では依然としてNVIDIAが頭ひとつ抜けている印象です。