要点テキストから画像を生成する…
解説
ねえねえ智也くん!この『MARTI-MARS2』って論文、タイトルが強そうだね!もしかして火星探査ロボットのAIの話?
いや、火星(MARS)は関係ないよ。これは複数のAIをチームにして、プログラミングの能力をめちゃくちゃ高めるっていう研究なんだ。
えー、火星じゃないんだ。でもAIのチームって面白そう!一人で頑張るより、みんなで協力したほうがいいってこと?
その通り。今のAIは一人でもすごいけど、難しいプログラミングの問題だとどうしても限界が来ちゃうんだ。それを「性能の天井」って呼んだりするんだけど、この論文はそれを「チームワーク」で突破しようとしているんだよ。
チームワークかぁ。でも、同じ性格のAIが何人いても、同じところで間違えちゃいそうじゃない?
お、鋭いね。そこがこの論文の面白いポイントなんだ。同じモデルを使う「ホモジニアス(同質)」なチームよりも、違う種類のモデルを混ぜた「ヘテロジニアス(異質)」なチームの方が、お互いのミスを指摘し合えて、より賢くなることがわかったんだよ。
へぇー!「ヘテロ」なんとかって、個性が大事ってことだね。具体的にどうやって賢くなるの?
「強化学習」と「木探索(ツリーサーチ)」を組み合わせているんだ。強化学習は、正解したら褒められることで学習する方法。木探索は、迷路の分かれ道を全部試すみたいに、いろんな解決策を枝分かれさせて検討する手法のことだよ。
なるほど!みんなでいろんなアイデアを出し合って、一番いい枝を選んでいく感じかな?
そう。しかも、ただ相談するだけじゃなくて、実行してエラーが出たらそのメッセージをフィードバックして、また考え直すっていう「MARS2-T+」っていう推論テクニックも使っているんだ。これで、本番でも粘り強く正解を探せるようになる。
粘り強いAI、頼もしいね!それで、結果はどうだったの?
これがすごくてね。32Bっていう中くらいのサイズのモデルを2つ協力させただけで、あのGPT-5.1を超える性能を出しちゃったんだ。スコアで言うと77.7%だね。
ええっ!あの有名なAIよりすごいの!?チームの力、恐るべしだね……。
この研究の意義は、AIを賢くする方法が「モデルを大きくする」だけじゃないって示したことにあるんだ。「多様なAIを組み合わせて協力させる」ことが、新しい進化の道(スケーリング則)になるかもしれない。
これからは、いろんな性格のAIを育てるのが流行るかもね!でも、難しいところはないの?
課題としては、やっぱり計算コストかな。複数のAIを同時に動かして何度もやり取りさせるから、時間がかかるしお金もかかる。今後は、もっと効率よく協力させる方法が研究されると思うよ。
なるほどね〜。多様性が大事なら、私みたいな天然キャラを100人集めたら、アインシュタインもびっくりな大発明ができちゃうかも!?
いや、それはただの「天然の渋滞」でしょ。多様性以前に、ベースとなる賢さが揃ってないと意味ないんだよ。
要点
- 単一のAI(エージェント)では複雑なコード生成タスクにおいて性能の限界(天井)があることを指摘。
- 複数のAIが協力して問題を解く「マルチエージェント」体制を、強化学習と木探索(ツリーサーチ)で最適化するフレームワーク「MARTI-MARS2」を提案。
- 同じ種類のAIを並べる(ホモジニアス)よりも、異なる種類のAIを組み合わせる(ヘテロジニアス)方が、多様な視点が生まれて性能が大幅に向上することを発見。
- 32Bサイズのモデル2つを協力させることで、GPT-5.1などの強力なモデルを超える77.7%のスコアを達成。
- AIの知能を拡大させるための新しい法則(スケーリング則)として、モデルの大きさだけでなく「エージェント間の多様性」が重要であることを示した。