AIが二重の思考でサイバー攻撃を再現？脆弱性対策を爆速にする新技術「Cve2PoC」

2月 08 2026

解説

ねえねえ智也くん！この「デュアルループ」っていう論文、なんだか遊園地のアトラクションみたいで面白そう！

亜美さん、それは遊びじゃなくてセキュリティの研究だよ。脆弱性、つまりコンピュータの弱点を見つけた後に、それが本当に動くかどうかを確かめる「PoC」っていう攻撃コードを自動で作る仕組みの話なんだ。

ぴーおーしー？攻撃コードを作るなんて、なんだか悪いことしてるみたい！

逆だよ。脆弱性が報告されても、実際にどうやって悪用されるかが分からないと、対策が立てられないんだ。だから、防御側が「確かにこの弱点は危ないね」って確認するために必要な作業なんだけど、今は専門家が手作業でやっててすごく大変なんだよ。

なるほど、お医者さんが病気の原因を特定するみたいなものかな？でも、AIに任せればすぐできそうなのに。

それが難しいんだ。これまでのAIは、攻撃の「作戦」が間違っているのか、それとも「コードの書き方」がちょっと間違っているだけなのかを区別できなかった。だから、作戦自体がダメなのに、一生懸命コードの細かいミスを直そうとして、結局失敗しちゃうことが多かったんだよ。

あー、カレーを作ろうとしてるのに、材料が全部デザート用だったら、いくら煮込み方を工夫してもカレーにはならないもんね！

……例えは独特だけど、まさにその通り。そこでこの論文が提案したのが「Cve2PoC」っていう二重ループの仕組みなんだ。

二重ループって、どういうこと？

まず「戦略プランナー」が脆弱性の説明を読んで、どう攻めるかの計画を立てる。次に「戦術エグゼキューター」がその計画に沿ってコードを書く。もし動かなかったら「適応リファイナー」が原因を分析して、コードのミスならコードだけ直す（戦術ループ）、作戦ミスなら計画から練り直す（戦略ループ）って分けたんだ。

すごい！ちゃんと「何がダメだったか」を考えてからやり直すんだね。賢い！

さらに、検証もすごく厳格なんだ。単にエラーが出ないだけじゃなくて、ちゃんと狙った通りの動作をしているか、修正済みのバージョンでは動かないかまでチェックする。これで「たまたま動いた」っていう間違いを防いでいるんだよ。

それで、結果はどうだったの？AIくんはちゃんとハッカーになれた？

ハッカーじゃなくてセキュリティエンジニアね。実験では、JavaScriptの脆弱性再現率が82.9%に達して、これまでの最高記録を10%以上も塗り替えたんだ。人間が書いたコードと比べても、読みやすさや再利用のしやすさで高い評価を得ているよ。

82.9%！私のテストの点数よりずっと高いよ……。これがあれば、世界中のコンピュータがすぐに安全になるね！

将来は、脆弱性が報告された瞬間に自動でPoCが作られて、すぐに対策パッチが正しいか検証できるようになるだろうね。ただ、まだ課題もある。複雑な論理のバグや、情報が少なすぎる報告書には対応しきれないこともあるんだ。

ふむふむ。じゃあ、もっともっとAIを賢くして、いつか「お母さんに隠されたお菓子を見つけるPoC」も作ってもらおうかな！

それは脆弱性じゃなくて、亜美さんの自業自得でしょ。自分で探しなよ。

脆弱性報告（CVE）から、実際にその脆弱性を再現できる攻撃コード（PoC）を自動生成するフレームワーク「Cve2PoC」を提案。
既存のAIエージェントは「攻撃の戦略」と「コードの実装」を混同してしまい、失敗した時に無駄な修正を繰り返すという課題があった。
Cve2PoCは「戦略ループ」と「戦術ループ」の二重構造（デュアルループ）を採用。戦略が間違っていれば計画を立て直し、コードのミスなら実装を修正するという切り分けを可能にした。
実験では、既存の最高手法と比較して成功率を11%〜20%向上させ、人間が書いたコードと同等の品質を実現した。
セキュリティ担当者の負担を大幅に軽減し、迅速なパッチ検証や防御策の展開に貢献することが期待される。

投稿日:AI