たった7%のデータで天才に！？AIの『思考力』を爆上げする新手法

2月 01 2026

解説

ねえねえ智也くん！この『MMFineReason』っていう論文、何がすごいの？名前からして、すごく細かく理由を教えてくれそうな感じだけど！

お、そこに目をつけたか。これはね、画像を見ながら論理的に考えるのが苦手だったオープンソースのAIを、一気に賢くするための研究だよ。

画像を見ながら考える？あ、間違い探しとか、図形の問題とかのこと？

そうそう。今のAIって、文章だけなら得意だけど、図解入りの算数やパズルになると、急に間違えることが多かったんだ。それは、お手本になる『質の高いデータ』が足りなかったからなんだよね。

データが足りないなら、インターネットからたくさん集めればいいじゃない！画像なんていっぱい落ちてるでしょ？

ただの画像じゃダメなんだ。どうやってその答えに辿り着いたかっていう『思考のプロセス』、つまりChain-of-Thought（CoT）が必要なんだよ。この論文では、めちゃくちゃ巨大で賢いモデルに、180万問もの問題の解き方を詳しく書かせて、それをデータセットにしたんだ。

へぇー！賢い先生に、詳しい解説付きの解答ノートを書いてもらったってことか。それを『蒸留』って呼ぶんだっけ？

物知りだな。そう、巨大なモデルの知恵を、小さなモデルに受け継がせる手法だね。この研究の面白いところは、ただデータを集めるだけじゃなくて、収集、蒸留、そして選別っていう3つのステップをシステム化したことなんだ。

選別？せっかく集めたのに捨てちゃうの？もったいない！

そこがこの論文の肝だよ。実は、難しい問題や質の高いデータだけを厳選した『7%のデータ』だけで学習させても、全部使った時と同じくらい賢くなったんだ。これを『Less is more』現象って呼んでるよ。

ええっ！93%もサボっていいの！？私もテスト勉強、7%だけで済ませたいな〜！

亜美さんの場合は、その7%を選ぶセンスがないから無理だと思うけど。……で、結果として、この手法で作った4B（40億パラメータ）のモデルが、倍のサイズの8Bモデルに勝っちゃったんだ。さらに8Bモデルは、30Bクラスの巨大モデルに匹敵する性能を出したんだよ。

小さいのに力持ちなんだね！これがあれば、私のスマホでも難しいパズルを解いてくれるようになるかな？

将来力的にはそうだね。STEM教育のサポートや、複雑な図面を読み取る仕事とか、応用範囲は広い。ただ、まだ課題もあって、画像の解像度を上げすぎても推論能力はそこまで上がらないとか、パズル系の問題はまだ伸び代があるみたいだ。

なるほどね〜。じゃあ、私も智也くんの脳みそから知識を『蒸留』して、明日のテストを乗り切っちゃおうかな！智也くん、ちょっと頭貸して！

物理的に頭を貸しても意味ないだろ。大人しく自分で勉強しろ。

よし、決めた！私も今日から『Less is more』の精神で、睡眠時間を93%にして、活動時間を7%にするね！

それ、ただの寝過ぎだろ。逆だよ、逆！

投稿日:AI