解説

AMI HAPPY

ねえねえ智也くん!この『EvoFSM』っていう論文のタイトル、なんだか強そうだね!AIがエボリューション、つまり進化しちゃうってこと?

TOMOYA NEUTRAL

そうだね。簡単に言うと、AIエージェントが自分で自分の「仕事の進め方」を書き換えて、どんどん賢くなっていく仕組みについての研究だよ。

AMI SURPRISED

ええっ、AIが勝手に自分を改造しちゃうの?それって、映画みたいに暴走して人類を支配したりしない?大丈夫?

TOMOYA NEUTRAL

そこがこの論文の面白いところなんだ。今までの「自己進化」するAIは、自分のルールを自由に書き換えすぎて、本来の目的を忘れたり、デタラメを言ったりする「暴走」が問題だったんだよ。この論文は、それを防ぐために「有限オートマトン(FSM)」っていう型を使ってるんだ。

AMI SURPRISED

ゆうげん……おーとまとん?なにそれ、美味しいの?

TOMOYA NEUTRAL

食べられないよ。FSMっていうのは、簡単に言えば「今の状態」と「次に何をすべきか」を地図みたいにまとめた仕組みのことだね。この論文では、AIの進化を「Flow(フロー)」と「Skill(スキル)」の2つに分けて考えてるんだ。

AMI AMI

フローとスキル?どう違うの?

TOMOYA NEUTRAL

「Flow」は全体の作戦会議みたいなもので、どの順番でツールを使うかっていう手順のこと。「Skill」は、検索したりPDFを読んだりする個別の技のことだね。この2つをバラバラに、でもルールに従って修正していくのが『EvoFSM』の特徴なんだ。

AMI HAPPY

なるほど!「まずは検索して、次にPDFを読んで……」っていう地図を書き換えるのがFlowで、検索のやり方自体を上手にするのがSkillってことだね!

TOMOYA NEUTRAL

正解。しかも、書き換えるときは「原子操作(Atomic Operations)」っていう、あらかじめ決められた最小単位の操作しかできないようになってる。例えば「新しい手順を追加する」とか「指示を少し書き換える」といった感じだね。これを「Critic(批評家)」役のAIがチェックしながら進めるから、変な方向に進化しにくいんだ。

AMI NEUTRAL

ちゃんと見張り役がいるんだね。でも、毎回ゼロから進化させるのって大変じゃない?

TOMOYA HAPPY

いいところに気づいたね。そこで「自己進化メモリ」の出番だ。過去にうまくいった手順は「お手本」として、失敗したパターンは「これはやっちゃダメ」っていう「制約」として保存しておくんだよ。次に似たような問題が来たときは、その経験を活かして最初から賢い状態でスタートできるんだ。

AMI HAPPY

すごーい!経験を無駄にしないタイプなんだね。それで、実際にどれくらい頭がいいの?

TOMOYA NEUTRAL

実験では、複数の難しい検索タスクで、あのGPT-4oを使った従来の手法よりも高い成績を出してるよ。特に「DeepSearch」っていう複雑な調査が必要なテストでは、58.0%っていう高い精度を叩き出したんだ。

AMI NEUTRAL

58%って聞くと低そうに見えるけど、難しい問題ならすごい数字なんだよね?

TOMOYA NEUTRAL

そうだよ。ネット上の情報をあちこち探し回って、矛盾がないようにまとめるのはAIにとってもかなり難しいからね。この技術があれば、将来はもっと複雑な専門調査もAIが自動でやってくれるようになるはずだ。

AMI NEUTRAL

将来が楽しみだね!でも、課題とかはないの?

TOMOYA NEUTRAL

もちろんあるよ。まだ進化のステップに時間がかかるし、もっと多様なタスクに対応させる必要がある。これからは、もっと効率よく、かつ安全に自己進化させる研究が進んでいくだろうね。

AMI HAPPY

そっかぁ。じゃあ私も『EvoFSM』を使って、朝寝坊しないように自分を「構造的に自己進化」させちゃおうかな!

TOMOYA NEUTRAL

亜美さんの場合は、FSMを書き換える前に、まず目覚まし時計を増やすっていう「物理的なスキル」を強化したほうがいいと思うよ。

要点

  • 従来のAIエージェントは、手順が固定されていて柔軟性に欠けるか、自由すぎて自己修正時に「指示の逸脱」や「幻覚」を起こして不安定になるという課題があった。
  • 提案手法の『EvoFSM』は、有限オートマトン(FSM)という構造を利用して、AIの行動を「Flow(全体の流れ)」と「Skill(個別の能力)」に切り分けて管理する。
  • AIの進化を「状態の追加」や「プロンプトの修正」といった、あらかじめ定義された「原子操作(Atomic Operations)」に制限することで、暴走を防ぎつつ賢くすることができる。
  • 「自己進化メモリ」を搭載しており、過去の成功例をヒントに、失敗例を制約として蓄積することで、使えば使うほど未知のタスクに強くなる。
  • 複数の難解な質問回答(QA)ベンチマークで、GPT-4oなどの既存手法を上回る高い精度を達成した。