AIがAIをテストする時代？知識の地図で賢い問題を作る「KNIGHT」がすごい！

2月 25 2026

解説

ねえねえ智也くん！この「KNIGHT（ナイト）」っていう論文のタイトル、すごくかっこいいね！中世の騎士がAIの世界を救いに来たの？

いや、騎士の話じゃないよ。これは「Knowledge-graph-driven Natural Item Generation with Adaptive Hardness Tuning」の略だ。AIが解くためのテスト問題を、賢く自動で作る仕組みのことだよ。

えー、AIが自分でテストを作るの？それってカンニングみたいなものじゃない？

そうじゃない。最近はLLMがすごく進化してるけど、その実力を測るための「良い問題集」を作るのは、人間がやると時間もお金もかかるんだ。だから、信頼できる知識を元に、自動で高品質な問題を作る技術が必要なんだよ。

なるほどね！でも、AIが適当に嘘の問題を作っちゃったりしないの？

そこがこの論文の面白いところでね。まず「知識グラフ」っていうものを作るんだ。これは、単語と単語の関係を網の目みたいにつないだ「知識の地図」みたいなものだよ。この地図を元に問題を作るから、デタラメになりにくいんだ。

知識の地図！なんだかワクワクするね。でも、どうやって問題の難しさを変えるの？

「マルチホップ」っていう考え方を使うんだ。例えば、地図上で隣り合ってる知識から問題を作れば簡単だけど、2つ、3つと離れた知識を組み合わせて答えさせるようにすれば、難易度が上がる。これを「ホップ数」で調整するんだよ。

へぇー！「AはBである」だけじゃなくて、「Aに関連するBの、そのまた先のCは何？」みたいに聞くってことだね。智也くん、頭いい！

僕じゃなくて論文の著者がね。具体的な手順としては、まずWikipediaとかから情報を取ってきて知識グラフを作る。次に、そのグラフの道筋を辿って問題と選択肢を作る。最後に、別のLLMが「この問題は文法がおかしくないか」「答えは本当に一つか」って厳しくチェックするんだ。

厳しい先生（LLM）が最後にチェックしてくれるんだね。それで、実際にやってみてどうだったの？

歴史、生物、数学の3つの分野で試したんだけど、すごく高品質な問題ができたみたいだよ。しかも、普通にLLMに問題を作らせるより、嘘（ハルシネーション）が少なくて、コストも安く済むんだ。知識グラフを一度作れば、それを何度も使い回せるからね。

すごい！これがあれば、学校の先生もテスト作りが楽になるかな？

そうだね。教育現場だけじゃなくて、企業の社内資料から問題を作って研修に使ったり、特定の専門分野に特化したAIの能力を測ったりするのにも役立つはずだよ。将来性はかなり大きいと思う。

でも、何か弱点はないの？無敵の騎士様にも弱点はあるでしょ？

鋭いね。今はWikipediaを元にしてるけど、もっと複雑な専門知識や、図表が含まれるような情報をどう扱うかが今後の課題かな。あと、知識グラフを作る段階で間違った情報が入ると、問題も間違っちゃう可能性がある。

そっかぁ。じゃあ、私も智也くん専用の「KNIGHT」を作って、私の好きな食べ物クイズを100ホップくらいで作っちゃおうかな！

100ホップも辿ったら、もう食べ物の話じゃなくなってるだろ。いい加減にしてくれ。

投稿日:AI