AIの「知ってるつもり」を卒業！真の思考力を授ける新技術RADAR

2月 26 2026

解説

ねえねえ智也くん！この『RADAR』って論文、もしかしてスピード違反を取り締まるAIの話？かっこいいね！

全然違うよ。これは知識グラフっていう、世の中の事実を「AはBの首都だ」みたいにつなげたネットワークを、AIにどうやって正しく推論させるかっていう研究だよ。

知識グラフ……？あ、家系図のすごい版みたいなやつ？でも、今のAIならそんなの余裕で解けちゃうんじゃないの？

そこが問題なんだ。今のモデルは、単語が一緒に現れる確率を覚えているだけなんだよ。例えば「パリ」と「フランス」がネット上でよくセットで出てくるから、中身を理解せずに「首都だ」って答えてるだけの場合が多いんだ。

えっ、それってテストの答えを丸暗記してるだけってこと？応用問題が出たら解けないタイプじゃん！

その通り。だからこの論文では、生成するんじゃなくて「識別する」っていう方法に変えたんだ。名付けて『RADAR』。これがすごく賢いんだよ。

識別？どういうこと？

記述式のテストじゃなくて、選択肢から選ぶ形式にするんだ。しかも、わざと紛らわしい「ひっかけ選択肢」を混ぜて、強化学習で「なぜこれが正解で、なぜこれはダメなのか」を徹底的に叩き込むんだよ。

スパルタだ！でも、強化学習ってあの、囲碁とかで使われてるすごいやつでしょ？

そう。GRPOっていう最新の強化学習アルゴリズムを使って、モデルが「単語の並び」じゃなくて「事実の関係性」を理解するように訓練するんだ。さらに面白いのが、推論のやり方だよ。

推論のやり方？普通に喋らせるんじゃないの？

普通はテキストを出力させるけど、それだとハルシネーション、つまり「もっともらしい嘘」をつくリスクがある。RADARは、モデルの頭の中にある「表現（ベクトル）」を直接取り出して、それが正解に近いかどうかを判定するんだ。

喋らせずに、脳波で直接会話するみたいな感じ！？かっこいい！それで、結果はどうだったの？

4つの大きなテストで、これまでの最強モデルより5〜6%も精度が上がったんだ。特に、学習データにない未知の組み合わせに対しても、すごく強くなったのがポイントだね。

5%って地味に見えるけど、AIの世界だと大進歩なんだよね？これがあれば、もっと正確な検索エンジンとかができるのかな？

そうだね。医療データとか法律みたいな、絶対に嘘が許されない分野での知識活用にすごく期待されてるよ。ただ、まだ課題もあって、選択肢を作るのに別のAIモデルが必要だったり、計算コストがかかったりするんだ。

なるほどね〜。でも、AIがちゃんと「意味」を理解しようとしてるのは嬉しいな！

よし、私の頭の中のRADARも、今日のご飯が「カレー」か「ラーメン」かを識別するためにフル稼働させるね！

それはただの食欲だろ。君のRADARは、まず講義の単位を落とさないために使いなよ。

LLMによる知識グラフ推論（KGR）において、単なる単語の共起関係の暗記（表面的なパターンマッチング）ではなく、真の論理的関係を学習させる手法「RADAR」を提案。
KGRを「テキスト生成」ではなく「選択肢からの識別」というタスクに再定義し、強化学習（GRPO）を用いることで、正解と不正解を明確に区別する能力を強化した。
推論時にテキストを生成させるのではなく、モデル内部の「表現空間（ベクトル）」で直接判定を行うことで、ハルシネーション（もっともらしい嘘）を抑制。
4つのベンチマークで既存手法を5〜6%上回る精度を達成し、未知のデータに対する汎化性能やドメイン転移能力が大幅に向上した。

投稿日:AI