「危険な」AIモデルの登場は避けられない局面に

■事実

Anthropicは2026年4月7日、内部開発の「Claude Mythos Preview」を発表しました。AIモデルが、ソフトウェアの脆弱性発見・悪用において大半の人間の専門家を上回る水準に達したという事実を示すモデルだと位置づけ、一般公開はせずApple・JPMorganなど約40社限定のパイロット提供とする「Project Glasswing」を開始しました。

2026年6月2日、トロント大学とVector Instituteの研究チームが、誰でも入手できるオープンウェイトAIモデルを使い、感染先ごとに攻撃戦略を自律的に調整する「ワーム」型マルウェアの概念実証を発表しました。

6月4〜5日、Anthropicは「AIの能力向上が速すぎるため、人間がAIを制御できなくなるリスクがある」として、主要AI企業が協調して開発を一時停止できる体制づくりを提案し、一方OpenAIは同時期の発表で、開発速度の決定権は政府にあるべきだとする異なる立場を示しました。

Anthropicは6月上旬、Mythos技術を基盤としつつサイバー・バイオ関連の能力を制限した一般提供版「Claude Fable 5」と、非公開で政府・特定パートナー限定の「Claude Mythos 5」を発表しました。

6月12日(金)17時21分(米東部時間)、米商務省がFable 5・Mythos 5について「米国内外を問わず外国籍ユーザー全員」へのアクセスを禁止する輸出規制指令をAnthropicに送付しました。報道によればAmazonのCEOアンディ・ジャシー氏が、自社の検証で同モデルから制限されているはずのサイバー攻撃関連情報を引き出せたとして政権側に懸念を伝えたことが発端の一つとされています。(中国系グループによる悪用が疑われたとの報道もあるが、根拠は明示されていない)。

規制の対象は外国籍のAnthropic従業員も含むため、Anthropicは規制順守のため両モデルへのアクセスを全ユーザー向けに無効化した一方、Opus 4.8など他のモデルは対象外としました。

Anthropicは公式声明で、問題視されたジェイルブレイク手法は限定的なもので、同様の手法はOpenAIのGPT-5.5など他社の公開モデルでも再現可能であり、Mythos固有の優位性を与えるものではないと反論しました。

反応は分かれた。トランプ政権のAI政策顧問デビッド・サックス氏はAnthropicを以前から「恐怖を利用した規制虜獲(レギュラトリー・キャプチャー)戦略」だと批判してきた人物で、今回も対応の不備を指摘。一方Adobe・Zoom・Sophos・NVIDIAなど80社超のセキュリティ企業幹部が規制解除を求める公開書簡「FreeFable」に署名しました。署名者の一部は4月時点でMythos級モデルの危険性自体を警告していた当事者でもあります。

背景として、米国防総省は2026年3月、Anthropicが軍事利用や国内監視への自社モデル提供を拒否したことを理由に同社を「サプライチェーンリスク」と認定しており、今回が政権とAnthropicの2度目の正面対立となります。

同社固有の問題かどうかについて、第三者評価機関METRが2026年2〜3月に実施したAnthropic・Google・Meta・OpenAI4社の内部最先端モデル調査では、いずれも公開されている最先端モデルを大きく上回るものではなかったと報告されています。

日付	出来事
4月7日	Claude Mythos Preview発表、Project Glasswing開始(約40社限定)
6月2日	トロント大学が自律拡散型AIワームの概念実証を発表
6月4〜5日	Anthropicが業界に開発一時停止の協調体制を提案、OpenAIは異なる立場を表明
6月上旬	Claude Fable 5(一般提供)・Mythos 5(限定提供)発表
6月12日17:21(ET)	米商務省が輸出規制指令を送付
6月13日	Anthropicが全ユーザー向けに両モデルを無効化
6月15日	セキュリティ業界80社超が規制解除を求める公開書簡に署名

解説

そもそもの構図が皮肉。Anthropicは4月から「自社モデルは危険すぎる」「政府に止めてほしい」と公言してきた側であり、今回政府がその言葉を字義どおり受け取って実際に止めただけ、という見方も成立する。

ただしサックス氏の批判にも矛盾がある。「危険性を煽る規制虜獲だ」と非難しつつ、その同じ製品を政府が実際に止めたことは支持するという立場は、論理的にはやや一貫性を欠く。

今回の発端とされる根拠は、Amazon側のプロンプトテストで「制限されているはずの情報が出てきた」という1件の報告にとどまる。技術的な厳密な検証より、関係各社の政治的な距離感がどちらに転ぶかを左右した側面が大きそうだ。

「FreeFable」書簡の署名者に、4月時点でMythos級モデルの危険性を自ら警告していた人物が含まれている点は見どころ。抽象的な「危険性」の議論と、実際に手元の防御ツールが止まって困るという現場の実感は、別の話だということがよく分かる一件。

Anthropic1社をめぐる今回の騒動の結末がどうなるかとは別に、トロント大学の概念実証やMETRの業界横断調査が示すのは、攻撃的なAI能力の向上が特定1社の製品にとどまらない構造的な現象だという点。1社を止めても全体の流れは変わらない。

「危険すぎるので一般公開しません」と自分で宣言した数週間後に、まさにその通りの理由で政府から止められて困惑する、という展開はなかなか自業自得感がある。

4月に危険性を警告していた人たちが6月には「早く返して」と署名する。AIの進化スピードより、人間側の立場の切り替えの方が速いのかもしれない。

■事実

関連タイムライン

解説