巨大AIはもういらない！？格安の「審判AI」がコード作成の常識を変える！

2月 15 2026

解説

ねえねえ智也くん！この「Small Language Model-as-a-judge」っていう論文、タイトルがかっこいいね！小さいモデルが裁判官になるの？

裁判官っていうか、プログラムの「審判」だね。最近のAIはコードを書くのが得意だけど、すごく巨大で動かすのに何百万円もする機材が必要なんだ。それを、もっと安くて小さいモデル、つまりSLMでなんとかしようっていう研究だよ。

えー、小さいモデルだと頭があんまり良くないんじゃないの？大丈夫かなぁ。

そこがこの論文の面白いところでね。1つのAIに完璧な答えを出させるんじゃなくて、まず小さいAIに10個くらい「これかな？」っていう回答を作らせるんだ。その中から、別の小さいAIが「これが一番正しい！」って選ぶ仕組みなんだよ。

なるほど！数打ちゃ当たる作戦だね！でも、その「選ぶ方」のAIも小さいんでしょ？ちゃんと正解がわかるの？

鋭いね。実は、そのままのSLMだと正誤判定は苦手なんだ。だからこの論文では、コードの正解と間違いの例をたくさん学習させる「ファインチューニング」っていう作業をして、審判専用の能力を身につけさせているんだよ。

特訓させるんだ！その特訓した審判AIは、どれくらいすごいの？

実験結果によると、1.3B（13億パラメータ）っていうかなり小さなモデルと審判を組み合わせただけで、その25倍も大きい33Bの巨大モデルに勝っちゃったケースもあるんだ。コストで言うと、170万円くらいする機材が必要なところが、10万円ちょっとの機材で済む計算だね。

ええっ！170万円が10万円に！？それはすごい節約だね！お小遣いが増えそう！

亜美さんの財布の話じゃないけどね。この研究の意義は、予算が少ない中小企業でも、自分たち専用の高性能なコード生成AIを安く運用できるようになることなんだ。特に、世の中にあまり出回っていない特殊なプログラミング言語を使っている会社には朗報だね。

いいことずくめじゃん！でも、何か弱点はないの？

もちろんあるよ。審判AIが「正しい」と判断しても、実際には細かいバグが残っていることもある。今後は、複数の審判AIを協力させて多数決を取ったり、もっと複雑なプログラムでも判定できるように改良していく必要があるね。

ふーん、審判も大変なんだね。よし、私も智也くんが今日のご飯を奢ってくれるか判定する「亜美ジャッジ」を導入するね！

それは審判じゃなくてただの強請りだろ。却下。自分で払いなよ。

投稿日:AI