Claude Mythos Previewの初期的評価

  • サイバー・情報セキュリティ
  • 経営・マネジメント

コラム

2026/5/1

 Anthropic社は2026年4月7日、開発した最新AIモデル「Claude Mythos Preview」を一般公開せず、特定企業群のみに提供すると発表した1。Mythosは汎用モデルだが、サイバーセキュリティ分野、具体的には脆弱性発見とエクスプロイト生成で突出したパフォーマンスを発揮するという。同社によれば、「ソフトウェアの脆弱性を発見・悪用する能力において、最も熟練した人間を除くすべての人間を凌駕できるレベルのコーディング能力に達している」。Mythosは全ての主要なOSとブラウザで効果を発揮したという。

 Anthropic社はモデルの出力を制御・抑制する安全装置が不十分なため、一般公開を見送った。他方、「Project Glasswing」と呼ばれる企業連合を組成し、サイバーセキュリティ(防衛)目的でMythosへのアクセスを許可する。企業連合はAmazon Web Services、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksの12社から構成され、今後、重要なソフトウェア等を開発・保守する40以上の組織にアクセスが拡大される。
 Anthropic社の発表と同じ日、米財務省と米連邦準備理事会(FRB)が米大手銀行のCEOを緊急招集し、対応を議論した。日本では4月20日に開催された、自民党国家サイバーセキュリティ戦略本部・金融調査会合同緊急会議で、金融システムを守る"日本版Project Glasswing"および基幹インフラ全体を対象とした拡大版"日本版Project Glasswing"の組成が提案された2
「基幹インフラ」とは、経済安全保障推進法上の基幹インフラ16業種(金融に加えて、電気、ガス、石油、水道、鉄道、貨物自動車運送、外航貨物、港湾運送、航空、空港、電気通信、放送、郵便の15種と追加指定予定の医療)だろう。少なくとも基幹インフラ事業者の経営層、リスク管理部門、IT・セキュリティ部門、事業部門は当面、Mythosとこれを取り巻く動向についてモニタリングを強化すべきだ。本稿は具体的なモニタリングポイントとして、①Mythosの能力そのもの、②企業のリスク管理への影響、③政策動向の3点について、現時点での初期的評価を紹介する。

Mythosの正確な能力を判断することは難しい

 Mythosはサイバー攻撃の工程のうち、脆弱性の発見→攻撃用エクスプロイトの生成という最も工数・時間のかかる工程を劇的に短縮する。Mythosが脅威的な能力であることは疑いがないが、それが「パラダイムシフト」なのか、従来の延長線上もしくは予見可能だった機能向上なのかを判断することは難しい。
 いくつかの第三者機関がMythosの能力・パフォーマンスを検証した。現時点でもっとも透明性の高い説明は、英国のAI安全研究所(AI Security Institute: AISI)が4月13日に公開したものであろう。AISIはキャプチャー・ザ・フラッグ(CTF)テストに加えて、専用仮想環境下での多段階攻撃シミュレーションでMythosを検証した結果、「これまでの最先端モデルを凌駕する性能を備えている」と判断する。同時にAISIは「Mythos Previewが[現実環境の]十分に防御されたシステムを攻撃できるかどうかは断言できない」と留保している。つまり、24時間365日の能動的監視体制、エンドポイント検出、リアルタイムでのインシデント対応といった実環境ではMythosの能力を検証できていない3。Mythosがエクスプロイト=攻撃実行以外のサイバー攻撃の工程、つまり、ターゲティング、初期侵入、検出回避・持続的アクセス維持等を含めて高いパフォーマンスを発揮するのであれば、人間の関与を最小限にしたサイバー攻撃キャンペーン全体の自動化・高度化という点で大きな脅威となる4
 他方、一部のセキュリティ専門家からは、Mythosの能力は過大評価され、「危険過ぎて公開できない」というのはAnthropic社のマーケティングの一環ではないかとの指摘もある。Mythosにアクセスできないユーザ企業がMythosの能力を正確に評価することは難しい。今後も独立した第三者機関の検証結果を継続的にフォローする必要がある。

脆弱性対応・パッチ管理の崩壊か、ベンダーロックインか

 Mythosや(今後、開発されるであろう)同水準モデルが企業に与える影響は、ゼロデイ等を悪用した深刻なサイバー攻撃に加えて、脆弱性対応・パッチ管理が総量的にも時間的にも崩壊する可能性があることだ。Mythos以前から既に、AIによる脆弱性発見が増加する中、いくつかのバグハンティング賞金大会が中止に至った。Mythosや同水準のモデルが、人間では実現できない規模とスピードでゼロデイや深刻な脆弱性を発見し続けることで、ベンダ側とユーザ側の双方の対応実務を崩壊させかねない。
 こうした懸念があるからこそ、Anthropic社はMythosを限定公開とし、Project Glasswingを組成したのだろう。既にMicrosoft社はソフトウェア開発工程でMythosを活用する計画を発表した。Mythosへのアクセスを厳格に管理し、ベンダ等がMythosを活用することで、全体として防御有利の環境が整備されるだろう。
 しかし、この取組みがうまくいった場合、ユーザ企業では別の問題が浮上する。最先端のAIモデルにアクセスすることのできるベンダやその製品・サービスが、サイバーセキュリティの成否を決定づけるならば、ユーザ企業ではAI時代のベンダーロックインが加速するだろう。

AIをめぐる規制が(これまでとは異なる形で)強化される

 Project Glasswingは開発事業者の「自主規制」であるが、今後、「政府規制」の検討が進む可能性がある。これまでのAI規制は、EUのAI法をはじめ、機微なデータへのアクセスや非倫理的利用に関わるものが中心であったが、今後は純粋にAIモデルの能力・パフォーマンスのみに着目した規制強化、国家安全保障の観点からのアクセス制限強化が検討されるだろう。
 多くの先端AIモデルを開発してきたのは米国テック企業であり、その米国企業に直接的な影響を及ぼしうる米国のAI規制は複雑な状況にある。第二次トランプ政権は前バイデン政権のAI規制方針を撤廃し、AI開発の競争推進・規制緩和を進めてきた。しかし、最先端モデルの軍事利用等については政権とテック企業(正確にはAnthropic社)で軋轢も生まれた。国家安全保障および中国との競争の観点から、トランプ政権はこれまで以上に、AI開発を促進しつつ、その成果に敵対者(国家であれ犯罪集団であれ)がアクセスすることを制限することは間違いない。さらにトランプ政権は、多くの企業(日本企業を含む)が先端モデルにアクセスすることを制限すべく、開発企業に働きける可能性が高い。他方、日本や主要国ではソフトウェアベンダ、クラウドサービスプロバイダー、サイバーセキィリティ企業、金融業界をはじめとした基幹インフラ・重要インフラへのアクセスを開放する試み・働きかけが継続されるだろう。
 別の観点の規制も想定される。Project Glasswingは競争法上の問題を惹起する可能性があり、米国では反トラスト法の執行状況も注目される。
 いずれも基幹インフラをはじめとしたユーザ企業を直接的に規制するものではないが、AI開発競争をめぐる規制動向はモニタリングすべきポイントの一つだ。

1  本稿のMythosおよびProject Glasswingに関する記述・引用は以下に基づく。"Project Glasswing: Securing critical software for the AI era," (Anthropic, April 7, 2026) <https://www.anthropic.com/glasswing> および Nicholas Carlini, et. al., "Assessing Claude Mythos Preview’s cybersecurity capabilities," red.anthropic.com (April 7, 2026) <https://red.anthropic.com/2026/mythos-preview/>
2  自民党国家サイバーセキュリティ戦略本部長の平将明氏(@TAIRAMASAAKI)によるXへの投稿(2026年4月21日) <https://x.com/TAIRAMASAAKI/status/2046389990754775117>
3  "Our evaluation of Claude Mythos Preview’s cyber capabilities," AI Security Institute (April 13, 2026).
<https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities>
4  事実、攻撃者はこうした着意を持ち、Mythos以外のモデルを悪用している。Anthropic社が2025年9月に検知したサイバー攻撃キャンペーンでは「全体として、攻撃者はAIを用いて攻撃キャンペーンの80~90%を実行し、人間の介入はごくまれにしか必要なかった(ハッキングキャンペーン1件あたり、重要な意思決定ポイントは4~6箇所程度)という。"Disrupting the first reported AI-orchestrated cyber espionage campaign," Anthropic (November 13, 2025) <https://www.anthropic.com/news/disrupting-AI-espionage>

執筆コンサルタントプロフィール

川口 貴久
ビジネスリスク本部 主席研究員

コンサルタントの詳細

コラムトップへ戻る