Mythosだけにとらわれず、「モデル+ハーネス」で防御する
攻撃側と防御側の非対称性について、中谷氏はこう整理する。「防御側に固有の優位が1点だけある。自分たちのソースコードを持っているということです」。攻撃者はウェブ——外部に公開されたインターフェース——からしか攻撃できず、ソースコードは見えない。防御側はソースコードをAIにスキャンさせ、内部から脆弱性を先回りして発見・修正できる。ただし現代のソフトウェア開発はOSS(オープンソースソフトウェア)を多用する。OSSのコードは誰でも閲覧できるため「OSSに脆弱性を見つけてそのOSSを使っていそうな企業を狙う」手法が攻撃者の常套手段だ。防御側の理論上の優位は実際にはかなり限定的だ——だからこそ、ソースコードを持つ側がAIを積極的に活用して先手を打つことに意味がある、というのが中谷氏の論点だ。
GPTやClaudeのフロンティアモデルで始められる──ハーネス設計が防衛力を決める
「Mythosというモデルだけに囚われる必要はない」と中谷氏は語る。その根拠が「モデル+ハーネス」という構造だ。モデルとはLLM(大規模言語モデル)本体、ハーネスとは複数のLLMを並列で動かし出力を相互に検証するオーケストレーション機構だ。MythosのベンチマークもAnthropicが内製したハーネス込みの数字であり、モデル単体の評価ではない。「フロンティアモデルにアクセスがなくてもハーネスで戦える」というのが中谷氏の核心的な主張だ。
AgenticSecは2025年初頭、AIエージェントが実際にシステムへの侵入経路を自律的に発見・突破するプロセスを世界で初めて完全自動化した。Mythosがまだ存在しない段階のことだ。同社プロダクト「AgenticSec Pentest」はこの技術を基盤に、攻撃者目線で「本当に危険な穴」を絞り込む継続的・自動ペネトレーションテストを提供する。大量の脆弱性報告をすべて修正しようとするとコストが膨大になる現場課題に対し、優先順位をAIが判断することで現実的な修正サイクルを実現する。今や手元にあるのは当時とは比較にならない水準のフロンティアモデルだ。
コード特化型のCodex、推論能力を強化したGPT-5.5、そしてClaudeの最新モデルによる脆弱性の検証も有効だと中谷氏は指摘する。UCバークレーらが主導する学術ベンチマーク「ExploitGym」では、GPT-5.5とMythosプレビューのサイバー能力の差は思いのほか小さい。「3つのLLMに同じ問いを投げて回答を集め、どれが正しいかをジャッジする別のLLMをさらに立てる──ハーネスの工夫次第で精度は出せる」と中谷氏は語る。Mythosを待っている間に、攻撃側はすでに現行モデルで動いている。
脆弱性対応の自動化から経営判断まで——AIサイバー時代の生存策
「24時間検知していても、ゼロデイ攻撃(世の中にまだ知られていない攻撃手法)は防げないのでは」——この問いに、中谷氏は「防げないことを前提に発想を転換すべき」と答えた。攻撃を食らうことを前提に「検知→封じ込め→復旧」という3段階の対応をAIで自動化することが本質だ。
経営アジェンダ化が出発点だ。攻撃者はビジネスとして技術投資を続けるインセンティブを持つ一方、防御側はいくら頑張っても売上が上がらない。このインセンティブ構造の非対称性を認識し、「IT部門・情シスのコスト」から「経営が判断する投資案件」へと引き上げることがすべての出発点となる。Mythosを機に「セキュリティ投資を上げなければとプロジェクトを立ち上げた」という経営層の声が増えていると中谷氏は話す。
検知→修正の自動化と高頻度化は、攻撃タイムラインの現実への応答だ。CVE(共通脆弱性識別子)が公開された当日に悪用される割合は28.96%(セキュリティ調査会社VulnCheck、2026年)、7日以内で55%を超える。一方、企業の修復中央値は55〜75日。年1回の手動ペネトレーションテストではこのギャップを埋められない。CVSSスコアのみでなく「自社環境で実際に攻撃が成立するかどうか」をリスクベースで評価しながら、継続的自動化を回す仕組みが必要だ。
「止めずに直せる基盤」への投資は、金融庁が「能動的なシステム停止への備え」まで要請するほど切迫している。冗長化(二重化)して本番環境とは別の環境でパッチを検証・切り替える設計を、セキュリティコストではなく事業継続への基盤投資として位置付け直すことが求められる。
AI進化への継続的な追従体制が長期的な防御力を規定する。Mythos級の能力はコモディティ化が進む。「どのモデルに賭けるか」より「何で動かすか」——最新モデルを継続的に吸収できるハーネスの設計力こそが、防御側の持続的な競争優位となる。
