NVIDIAを「存亡の危機」に追い込んだCUDAのGeForce搭載決断——ジェンスン・フアンが明かした20年越しの賭けの真相

■事実

Lex Fridman Podcast #494——2時間超のロングインタビュー

2026年3月23日、NVIDIAのCEOジェンスン・フアンが人気ポッドキャスト「Lex Fridman Podcast」（https://www.youtube.com/watch?v=ZUSPpDBEfmQ）に出演した。

このエピソード（#494）は約2時間を超えるロングインタビューで、CUDAの誕生秘話から「AIファクトリー」というNVIDIAの現在のアイデンティティに至るまで、フアン自身の言葉で語られている。

AIスケーリング則・ディープラーニング革命・フアン自身のリーダーシップ哲学など幅広いテーマが取り上げられたが、最も反響を呼んだのはCUDAをGeForceに搭載した決断に関する証言だった。

「専門家の罠」——アクセラレータ企業の構造的限界

フアンはまず、NVIDIAが創業初期から持っていた問題意識について語った。

GPUをゲーミング向けアクセラレータとして最適化することには明確な強みがある一方、市場規模がそのままR&D投資余力の上限を規定してしまうという構造的な問題がある。

「市場規模がR&D能力を決め、R&D能力がコンピューティングへの影響力を決める」とフアンは説明した。

つまり特定用途に特化すればするほど、より広いコンピューティング領域に影響を及ぼす能力が失われていく。

「コンピューティング企業として優れれば優れるほど、専門家としての強みは失われる。専門家として突き詰めれば、汎用コンピューティングへの影響力は消えていく」——この根本的な矛盾をフアンは「ファンダメンタルなテンション」と表現した。

NVIDIAが描いた答えは、「アクセラレータとしての強みを維持しながら、コンピューティングの射程を段階的に広げる」という細い道を一歩ずつ進むことだった。

プログラマブルシェーダーからFP32へ——CUDAへの伏線

NVIDIAが最初に打った一手が、プログラマブルピクセルシェーダーの発明だった。

2002年に登場したGeForce 3世代のプログラマブルシェーダーは、GPUをグラフィックス描画の固定パイプラインから解放し、開発者がGPUに直接ソフトウェアを書けるようにした最初のステップだった。

続いてフアンが強調したのが、シェーダーへのFP32（IEEE 754準拠の単精度浮動小数点数）演算の導入だ。

「FP32の実装は、ストリームプロセッサや各種データフロープロセッサの研究者たちにとって決定的な転機だった。CPU向けに書いていたコードをGPUで試せるかもしれないと気づいたのはこの瞬間だ」とフアンは語った。

FP32対応シェーダーの上にC言語ライクなプログラミングレイヤー「CG」を重ね、それが段階的にCUDA（Compute Unified Device Architecture）へと発展していった。

CUDAの開発は2004年に始まり、2006年にGeForce 8800 GTXとともに正式リリースされた。

当初CUDAという名称はCompute Unified Device Architectureの頭文字を取ったものだったが、NVIDIAはその後この略語の一般使用をやめ、現在は単に「CUDA」として通用している。

「存亡の危機」——CUDAをGeForceに乗せるという決断

フアンが「会社の存亡に最も近い戦略的決断」と語るのが、CUDAをゲーミングGPUのGeForce全ラインアップに搭載するという選択だ。

コンピューティングプラットフォームの成否を決める最大の要因についてフアンはこう断言した。

「インストールベースこそがアーキテクチャを定義する。それ以外のすべては二次的な問題だ」

この「インストールベース至上主義」は、x86アーキテクチャが何十年もの批判を浴びながら生き残り続けた事実と、美しく設計されたRISCアーキテクチャが多数失敗した事実を例として挙げて説明された。

CUDAが正式リリースされた2006〜2007年当時、競合するコンピューティングアーキテクチャとしてOpenCLが存在していた。

技術的な比較論ではなく、インストールベースで勝負することがNVIDIAの戦略だった。

GeForceはすでに年間数百万台規模で販売されていた。

「ゲーマーが使うかどうかに関わらず、すべてのPCにCUDAを搭載した状態で届ける。それがインストールベースを育てる出発点だ」とフアンは語った。

並行して開発者を呼び込むため、NVIDIAは大学を直接回り、教科書を執筆し、講義を行い、CUDAをあらゆる場所に普及させる活動を地道に続けた。

当時のクラウドは存在せず、PCが主要な計算環境だったため、GeForceを買った研究者・学生・エンジニアが「手元のゲーミングPCにスーパーコンピュータを持つ」状態を作り出すことが狙いだった。

時価総額80億ドルから15億ドルへ——10年間の苦難

この戦略が会社の財務に与えた打撃は深刻だった。

CUDAの搭載によってGPUの製造コストは約50%増加した。

NVIDIAは当時粗利益率35%の企業だった。コスト50%増は、会社の利益をほぼ丸ごと飲み込む計算になる。

ゲーマーはCUDAの存在すら知らない。CUDAのために余分に金を払う消費者はいない。

CUDA搭載コストをGeForceユーザーに転嫁することは不可能だった。

結果として、当時6〜80億ドル規模だった時価総額は約15億ドルにまで急落した。

「GeForceがCUDAのコストを一手に引き受け、ゲーマーは誰もそれに気づかず、誰もそれに金を払わない——そんな世界が現実になった」とフアンは振り返る。

ボードと経営チームへの説明は「いつかワークステーションやスーパーコンピュータへの展開で、そのセグメントではマージンを取れるようになる」という論理だったが、フアン自身も「理屈の上では成立するが、実際には10年かかった」と認めている。

2008年にはCUDA投資と収益化のタイムラグが表面化し、株価はさらに大きく下落した。

この時期、AMDの前身であるATI TechnologiesがRadeon HD 4000シリーズで急追しており、NVIDIAはゲーミング市場への注力が低下していたことも重なって一層厳しい状況に置かれた。

研究者たちがゲーマーとしてCUDAを発見した

賭けが成立した背景には、偶然とも必然ともつかない状況があった。

大学の研究室でCUDAを発見した科学者・研究者の多くは、もともとゲーマーだった。

自分でPCを組み上げ、PC部品を使ってクラスタを自作することも珍しくなかった。

研究費が限られた学生・研究者が、手元のゲーミングPCで本来スーパーコンピュータを必要とする計算を走らせられる——その可能性に気づいたのがCUDA普及の起点だった。

気象シミュレーション・分子動力学・計算金融・天体物理学といった分野で、CUDAは静かに広がっていった。

「NVIDIAはGeForceが建てた家だ。GeForceがCUDAを世界中の研究者に届けた」——これがフアンの総括だ。

このインストールベースが2012年のAlexNetによるImageNet制覇以降のディープラーニング革命の基盤となり、現在のAIインフラの礎を形成した。

AlexNetではNVIDIA GeForce GTX 580を使って畳み込みニューラルネットワークの学習が行われており、これはまさにCUDAのGeForce搭載戦略が産み落とした成果だった。

ジェンスン・フアンのリーダーシップ哲学——「信念体系の形成」

フアンは自身の意思決定スタイルについても詳しく語った。

大きな戦略転換を「マニフェスト」として突然発表するのではなく、日常的な会話の中で根拠と論理を少しずつ積み上げ、周囲の信念体系を時間をかけて形成していくというやり方だ。

「発表の日に従業員が『なぜ今頃？』という顔をするよう、ずっと布石を打ち続けている」とフアンは語った。

ボード・経営幹部・一般社員だけでなく、GTCのキーノートを通じてパートナー企業・クラウド事業者・業界全体にも同じ手法が使われているという。

CUDAの例でいえば、FP32の採用・CG言語・そしてCUDAの公開と、段階的に「次に何が来るか」を示し続けることで、NVIDIAが動いた時には業界の準備が整っているという状態を作ってきた。

「Grokを発表した際も、2〜2.5年前から布石を打ち続けていた。振り返ってみれば、ずっとそのことを話し続けていた」とフアンは振り返った。

なおフアンはNVIDIAについて「コンピューティングプラットフォーム企業」という自己規定を強調した。

製品を直接販売するのではなく、すべてのレイヤーをオープンに開放してパートナー企業のサービス・クラウド・スーパーコンピュータに組み込まれる形を取ることが核心だと説明した。

NVIDIAの現在地

CUDAへの10年以上にわたる投資の結果として、NVIDIAはデータセンターGPU市場で約90%超のシェアを握る支配的地位を確立している。

2025年7月時点で時価総額は4兆ドルを超え、人類史上初めて単独企業として5兆ドルを突破した。

この10年でAIコンピューティングの効率は100万倍以上向上しており、フアンはこれをムーアの法則による100倍の改善とは根本的に異なる次元の進歩と位置づけている。

CUDAのエコシステムには現在1,000人超の専任エンジニアが従事し、PyTorch・cuDNN・TensorRT・Tritonなど深層学習に不可欠なライブラリが積み上げられている。

データセンター部門の売上比率は5年前の40%から88%まで上昇しており、GeForce時代に育てたCUDAが今やNVIDIAの収益の大部分を支える構造になっている。

■解説

今回のLex Fridman Podcastでのジェンスン・フアンの証言、かなり読み応えがありました。

「会社が潰れかけた話」をこれだけ淡々と語れるのは、結果が出たからこそですが、当時の判断の合理性は今振り返っても筋が通っています。

ポイントは「インストールベースがアーキテクチャを決める」という原理原則です。

x86がどれだけ批判されても生き残り続けたのも、RISCがどれだけ優れた設計を持っていても普及しなかったのも、結局はこれで説明がつく。

CUDAとOpenCLの競争も同じ構図で、技術的な優劣よりも「どれだけ多くの開発者が実際に使っているか」が勝負を決めました。

NVIDIAがやったのはシンプルで、ゲーマー向けGPUを毎年数百万台売りながら、そのすべてにCUDAを「黙って」乗せ続けたということです。

ゲーマーはCUDAを求めていないし、CUDAのために余分に金を払うわけでもない。それでも乗せ続けた。

このコストが粗利益率35%の会社の利益をほぼ消滅させ、時価総額を60〜80億ドルから15億ドルに叩き落とした。

個人的に注目したいのは、「10年かかった」という点です。

AI時代に入ってから「NVIDIAは先見の明があった」という話がよく出ますが、実際にはこの10年間、投資家から見れば単なる不採算事業を抱えた半導体メーカーにすぎなかった。

2008年にはCUDA関連の投資と収益化のタイムラグが重なり株価が大きく暴落し、ディープラーニングが本格化した2012年のAlexNet以降も、CUDAが業績の主役になるにはさらに数年を要しています。

「正しい判断」と「正しい判断が報われる」の間には、平気で10年の時間差があるということです。

この話がAMDにとっての教訓になるとすれば、ROCmの話です。

AMDがROCmを本格整備し始めたのはずっと後のことで、当時NVIDIAが積み上げていたインストールベースとエコシステムの差はすでに埋めがたいレベルに達していた。

The Rockナイトリービルド（https://rocm.nightlies.amd.com/v2-staging/）でgfx906など旧アーキテクチャ向けを含めたPyTorch・JAX・Tritonのビルドが継続されているのは事実で、着実な改善は続いています。

ただ、CUDA向けに書かれた既存のコード資産・PTXレベルの依存関係・1,000人超の専任エンジニアが20年かけて積み上げたライブラリの厚みは、単純な「技術的追い上げ」では解決しない種類の問題です。

Nunchakuをはじめとした先端推論ライブラリがNVIDIA専用になっているのも、PTXレベルのCUDA依存が根本原因であり、ROCmが一朝一夕に解決できる話ではない。

フアンの言う「GeForceが建てた家」という表現は、単なる美談ではなく、意図的に設計されたプラットフォーム戦略の結果です。

ゲーマー向け市場でインストールベースを築き、その上に研究者・データセンター・クラウド事業者を乗せた。

今から同じことをやろうとしても、10年分の周回遅れを20年かけてもなお追いつけないかもしれない——それがCUDAのモートの本質です。

NVIDIAは商業政策的にいろいろと物議をかもすような行動をたびたび繰り返す企業ですが、どことなく憎み切れないところがあります。

それはやはりジェンセン自身が猛烈な苦労人であるところでしょうか。

NVIDIAが強いのはGPUが速いからじゃなくて、20年かけてCUDAという「乗り換えコスト」をAI産業の全員に背負わせることに成功したから、というわけです。