AIハッカーの誕生！？難攻不落のセキュリティを突破する最新AIの秘密

2月 20 2026

解説

ねえねえ智也くん！この論文のタイトルにある『ペネトレーションテスト』って何？なんだかスパイ映画みたいでワクワクするね！

それは、システムの安全性を確かめるために、善意のハッカーが実際に攻撃を仕掛けて弱点を探すテストのことだよ。最近はこれをAIに自動でやらせようっていう研究が進んでるんだ。

へー！AIの忍者修行みたいな感じかな？でも、AIなら計算も早いし、どんなシステムも簡単に攻略できちゃいそうだけど。

それがそうでもないんだ。この論文によると、今のAIエージェントには大きな壁があるらしい。研究チームが28個ものシステムを分析した結果、失敗には2つのパターンがあることがわかったんだよ。

失敗のパターン？気になる！教えて智也くん！

まず『Type A』は、単にツールが足りなかったり、指示が下手だったりする「能力不足」。これはエンジニアリングで解決できる。問題は『Type B』で、これはAIが「計画」を立てたり「状況」を管理したりするのが苦手なせいで起きる「複雑性の壁」なんだ。

複雑性の壁……。なんだか難しそう。具体的にどういうことなの？

簡単に言うと、AIは「今やってる作業がどれくらい難しいか」をリアルタイムで判断できないんだ。だから、絶対無理なルートにずっと固執して時間を無駄にしたり、逆に大事な証拠を見逃したりしちゃうんだよ。

あー、私もテストで解けない問題にずっと悩んで、時間がなくなっちゃうことある！AIも私と同じなんだね！

……まあ、似たようなものかな。そこでこの論文が提案したのが『PENTESTGPTV2』っていう新しいシステムなんだ。これには「タスク難易度評価（TDA）」っていう機能がついてる。

難易度評価？それがあるとどうなるの？

AIが「この道はあと何ステップかかりそうか」とか「手元にある証拠はどれくらい信頼できるか」を数値で計算するんだ。それをもとに『攻撃ツリー探索（EGATS）』っていうアルゴリズムを使って、見込みのないルートは早めに諦めて、一番成功しそうな道を選び直すんだよ。

賢い！諦める勇気も大事ってことだね。それで、その新しいAIは強かったの？

めちゃくちゃ強かったよ。CTFっていうハッキングの競技形式のテストで、なんと91%の成功率を叩き出したんだ。前のシステムより50%近くも性能が上がってる。さらに、複数のコンピュータが繋がった複雑な企業ネットワークの環境でも、ほとんどのターゲットを攻略できたんだ。

91%！？すごすぎるよ！これがあれば、もう人間のハッカーはいらなくなっちゃうかも？

いや、まだそこまではいかないかな。この論文でも言及されてるけど、全く新しい攻撃方法をゼロから考えたり、相手が仕掛けてくる巧妙な罠を見破ったりするのは、まだAIには難しいんだ。数週間にわたるような長期戦もまだ課題だね。

なるほどね。でも、AIがセキュリティを守るヒーローになる日も近そうだね！

そうだね。これからは、モデルを大きくするだけじゃなくて、こういう「難易度を判断する知能」をどう組み込むかが重要になってくると思うよ。

よし！じゃあ私もPENTESTGPTV2を使って、智也くんが隠してるお菓子の場所をハッキングしちゃおうかな！

それはハッキングじゃなくてただの泥棒だし、そもそもお菓子なんて隠してないから。……あと、勝手に僕の部屋を探さないでよ。

投稿日:AI