データが少なくても超優秀！？AIを『専門家』に変える魔法のレシピ

2月 05 2026

解説

ねえねえ智也くん！この『Less Finetuning, Better Retrieval』って論文、タイトルが気になる！「少ない努力で成績アップ」みたいな感じ？

まあ、あながち間違いじゃないよ。これはAIが特定の分野、特に医学とかの難しい情報を探す能力を、いかに効率よく鍛えるかっていう研究なんだ。

医学！難しそう……。AIって何でも知ってるんじゃないの？

一般的なことは知っていても、専門的な検索となると精度が落ちるんだ。そこで、この論文は『STM』っていう3ステップの魔法みたいな方法を提案しているんだよ。

STM？エス・ティー・エム……スーパー・楽しい・毎日？

違うよ。Synthesize（合成）、Train（学習）、Merge（統合）の略だ。まず最初の『合成』では、GPT-4を使って「ひっかけ問題」を作るんだ。

ひっかけ問題？AIをいじめるの？

そうじゃない。これを「ハードネガティブ」って言うんだけど、正解にすごく似ているけど実は間違い、っていうデータで学習させることで、AIの目利き能力を養うんだよ。あと、AIへの「指示の出し方（プロンプト）」も自動で最適化するんだ。

なるほど！厳しい特訓と、分かりやすい指示で鍛えるんだね。じゃあ、次の『学習』と『統合』は？

「学習」では、医療のリアルなデータや合成したデータを使って、特定の分野に強い「専門家モデル」をいくつか作る。そして最後の「統合（マージ）」が面白いんだけど、複数の専門家の知識を、追加の学習なしでガッチャンコして一つの最強モデルにするんだ。

ええっ！合体ロボみたい！それってすごいの？

すごいよ。実験では、従来の10%以下のデータしか使っていないのに、検索の精度が最大で23.5%も上がったんだ。大きなモデルをゼロから作るよりずっと効率的だね。

10%の力で120%の成果を出すなんて、コスパ最強だね！これがあれば、お医者さんも助かるのかな？

そうだね。膨大な医学論文から必要な情報をすぐに見つけられるようになるから、RAG（検索拡張生成）の精度も上がって、AIの嘘（ハルシネーション）も減らせるはずだよ。

未来の病院はAI図書館員さんが大活躍だね！でも、課題とかはないの？

今回は英語のデータが中心だから、他の言語やもっとニッチな分野でどうなるかはこれからの課題だね。でも、この「少ないデータで賢く作る」っていう流れは、今後のAI研究の主流になると思うよ。

よーし、私もSTMで「今日の晩ごはんを当てる専門家」と「宿題を代わりにやる専門家」をマージして、最強の智也くんモデルを作るね！

勝手に僕をマージしないでくれるかな。あと、宿題は自分でやりなよ。

投稿日:AI