AIが自分のミスを自分で添削！？難問を解くための新技術『InT』

1月 21 2026

解説

ねえ智也くん！この『InT』って論文、タイトルがかっこいいね！『介入』って、なんかヒーローが助けに来るみたい！

……まあ、AIの推論が失敗しそうなところを救うという意味では、ヒーローに近いかもしれないな。これはAIが数学みたいな難しい問題を解くときに、どこで間違えたかを自分で見つけて修正する技術なんだ。

えっ、AIって自分で間違いに気づけないの？いつも自信満々に答えてるイメージだけどなあ。

そこが今のAI学習の大きな課題なんだ。普通、強化学習では最後に答えが合ってるかどうかだけで判断する。これを『報酬の割り当て（Credit Assignment）』の問題って言うんだよ。

ほうしゅうのわりあて……？お小遣いの配分みたいなこと？

違う。例えば、100ステップある長い計算で、99ステップ目までは完璧だったのに、最後だけ計算ミスして答えが間違ったとするだろ？今の学習法だと、その完璧だった99ステップも全部『ダメな例』として罰せられちゃうんだ。

えー！それはかわいそう！私だったらショックで寝込んじゃうよ！

逆に、たまたま答えが合っちゃっただけのデタラメな推論も、全部『良い例』として褒められちゃう。これじゃ効率的に賢くなれないだろ？だから、どのステップが本当に悪かったのかを特定する必要があるんだ。

なるほどねー。じゃあ、この論文はどうやってその『犯人探し』をしたの？

そこで『InT』、つまり介入トレーニングだ。まず、AIに自分の書いた推論と、人間が書いた正解を比べさせる。すると、AIは『あ、ここで正解と違うこと言っちゃった！』って最初のミスを特定できるんだ。

自分で自分の間違い探しをするんだね！でも、それって自分で解くより難しくない？

実は、ゼロから問題を解くより、正解を見ながら間違いを探す方がAIにとっては簡単なんだ。この能力の差を利用して、ミスを見つけたらそこをどう直すべきかという『介入（Intervention）』を1ステップだけ生成させるんだよ。

1ステップだけ直して、あとはどうするの？

その修正したステップから、改めて最後まで解き直させる。これで『正しい道筋』が作れるだろ？この修正案をAIに学習させることで、AIは『こういうミスはこう直せばいいんだ』ってピンポイントで学べるようになるんだ。

へぇー！効率的だね！それで、実際にどれくらい頭良くなったの？

国際数学オリンピックレベルの難問で、精度が約14%も上がったんだ。40億パラメータっていう比較的小さなモデルなのに、その5倍も大きい有名なモデルに勝っちゃったんだよ。

すごーい！下克上だ！小さい子が巨人を倒したみたいでワクワクするね！

意義は大きいよ。今までは『どのステップが良いか』を判定する専用のモデルを別に作る必要があって、それがすごく大変だった。でもInTなら、モデル自身がその役割を兼ねられるから、すごくシンプルなんだ。

これからはAIが自分で自分を教育して、どんどん賢くなっていくのかな？

その可能性は高いね。ただ、課題もある。今は『正解データ』があることが前提だけど、正解が誰もわからない未知の問題に対してどう介入するかは、これからの研究課題だね。

そっかー。じゃあ、私のテストの答案も、智也くんが横から『介入』してくれたら100点になれるかな？

それは『介入』じゃなくてただの『カンニング』だろ。自分の脳をちゃんと学習させてくれ。

従来の強化学習（RL）では、最終的な正誤のみで評価するため、途中の正しいステップまで罰せられる「報酬割り当て（Credit Assignment）」の問題があった。
提案手法「InT（Intervention Training）」は、モデル自身が正解例と比較して、自分の推論の「最初の間違い」を特定し、修正案（介入）を生成する手法である。
この修正案（介入）を教師あり学習（SFT）に組み込むことで、モデルはどこで間違えたかを効率的に学習し、強化学習の優れた初期モデルとなる。
数学の難問データセット（IMO-AnswerBench）において、4Bという小規模なモデルながら20Bクラスのモデルを凌駕する精度向上（約14%）を達成した。
価値関数（Value Function）の学習や複雑な分岐ロールアウトを必要とせず、モデル自身の検証能力を活用するシンプルかつ強力なフレームワークである。

投稿日:AI