AIが「行き詰まり」を自ら突破！進化し続けるAIの新しいカタチ

1月 16 2026

解説

ねえ智也くん！この『PACEvolve』っていう論文のタイトル、なんだか強そうじゃない？「進化を加速させる」みたいな感じ？

ああ、それはLLMを使って科学的な問題やプログラミングの最適化を「進化計算」の手法で解くための新しいフレームワークだね。かなり画期的な内容だよ。

進化計算……？AIがポケモンみたいに進化して強くなっていくってこと？

例えは悪くないけど、正確には「たくさんの解の候補を作って、成績が良いものを残して改良を繰り返す」っていう手法のことだよ。でも、今のLLMを使った進化計算には大きな弱点が3つあるんだ。

弱点？あんなに賢いのに？

一つは『文脈汚染』。失敗した実験の履歴が溜まりすぎて、AIが混乱して変なアイデアばかり出すようになること。二つ目は『モード崩壊』。同じようなアイデアに固執して、行き詰まっちゃうこと。最後は『弱い連携』。並列で作業してる他のAIとうまく協力できないことだね。

なるほど、部屋が散らかってやる気が出なくなって、同じ間違いを繰り返して、友達とも喧嘩しちゃうみたいな感じだね！

……まあ、人間味のある解釈だけど、だいたい合ってるよ。PACEvolveは、それを解決するために3つの新しい武器を持ってるんだ。まずは『階層的コンテキスト管理（HCM）』。これはアイデアを「抽象的な作戦」と「具体的な解決策」に分けて整理して、不要なゴミ情報を捨てる仕組みだよ。

お掃除ロボットみたい！じゃあ、行き詰まった時はどうするの？

そこで二つ目の『モメンタムベースのバックトラッキング（MBB）』だ。AIが「最近あんまり改善してないな」っていう進捗の勢い、つまりモメンタムを自分で計算するんだ。勢いがなくなったら、思い切って過去の調子が良かった時点まで戻ってやり直すんだよ。

ええっ、タイムリープじゃん！かっこいい！

そう。そして三つ目が『自己適応型共同進化（CE）』。自分の過去に戻るか、それとも他の並列で頑張ってるチームから良いアイデアを盗んでくる（交叉）かを、状況に合わせて自動で選ぶんだ。これで協力プレイもバッチリだね。

すごーい！それで、実際に使ってみたらどうだったの？

数式を見つけるタスクや、GPUの計算を速くするコードの最適化で、これまでの記録を塗り替えて世界一の成績を出したんだ。特にNanoGPTっていう有名なモデルの改良では、これまでの最高記録をさらに更新したんだよ。

世界一！？これがあれば、どんな難しい問題もAIが勝手に解いてくれるようになりそうだね！

将来性は高いね。科学的な発見やエンジニアリングの自動化がもっと進むはずだ。ただ、まだ課題もある。計算コストがかかるし、どのタイミングで過去に戻るのがベストかっていう設定も、もっと洗練させる必要があるんだ。

ふむふむ。じゃあ、私もこのPACEvolveを使って、昨日の夜にポテチを食べすぎた過去までバックトラッキングして、なかったことにできるかな！？

それはただの現実逃避だろ。食べた事実は消えないから、大人しく運動してこい。

LLMを用いた進化計算における3つの主要な課題（文脈汚染、モード崩壊、弱い連携）を特定した。
階層的コンテキスト管理（HCM）により、アイデアの生成と選択を分離し、不要な失敗履歴がAIの判断を鈍らせる「文脈汚染」を防ぐ仕組みを提案した。
モメンタムに基づくバックトラッキング（MBB）を導入し、改善が停滞した（モメンタムが低下した）際に過去の状態に遡ることで、局所的な最適解に陥る「モード崩壊」を回避する。
自己適応型共同進化サンプリング（CE）により、並列して実行されている他の探索プロセスから知識を取り入れる「交叉」と、自身の過去に戻る「バックトラッキング」を動的に使い分ける。
数式回帰（LLM-SR）やカーネル最適化（KernelBench）、NanoGPTの改良において、従来手法を圧倒する世界最高水準の性能を達成した。

投稿日:AI