AIが「探し物」の達人に！複雑な依頼もこなす新技術TOOLQPの秘密

1月 13 2026

解説

ねえ智也くん、この『Beyond Single-Shot: Multi-step Tool Retrieval via Query Planning』っていう論文、タイトルがかっこいいね！「シングルショットを超えて」だって！

ああ、それはMITの研究だね。AIが数万個もあるツールの中から、どうやって適切なものを選び出すかっていう「ツール検索」の話だよ。

ツール検索？Google検索みたいに、使いたいツールの名前を入れればいいだけじゃないの？

それがそう簡単じゃないんだ。今のAIは「高密度埋め込み（Dense Embedding）」っていう、言葉を数字のリストに変換して似たものを探す方法を使ってるんだけど、これには限界があるんだよ。

限界？どんなところがダメなの？

まず「意味のギャップ」だね。例えば、ユーザーが「音声を高品質にして」って頼んでも、実際のツールは「lfilter」みたいな専門用語で説明されてる。これだと、単純な似たもの探しじゃ見つからないんだ。

あー、私が「美味しいもの食べたい」って言ってるのに、お店のメニューが全部フランス語で書いてあるみたいな感じかな？

……まあ、例えとしては悪くないかな。あとは、複数のツールを組み合わせなきゃいけない複雑な依頼だと、1回の検索じゃ情報が足りなくなるんだよ。

そこで登場するのが、この『TOOLQP』なんだね！どうやって解決するの？

TOOLQPは、検索を「1回きりのマッチング」じゃなくて「計画を立てるプロセス」に変えるんだ。具体的には、まず依頼を小さな「サブタスク」に分解する。これをプランニングと呼ぶよ。

サブタスクに分ける……。カレーを作るために、まず「野菜を買う」、次に「肉を切る」みたいに分けるってこと？

そう。そして、それぞれのサブタスクごとに検索クエリを生成して、検索結果を見てから「次はこれが必要だな」って修正しながら進めるんだ。これを「対話的なクエリ生成」と言うんだよ。

へぇー！賢い！でも、どうやってそんな賢いやり方を覚えるの？

「RLVR（検証可能な報酬を用いた強化学習）」っていう手法を使ってる。最終的に正しいツールが見つかったかどうかを報酬にして、モデルを鍛え上げるんだ。これによって、未知のツールに対しても柔軟に対応できるようになる。

実験の結果はどうだったの？やっぱりすごいのかな？

既存の最新手法（SOTA）を大きく上回る成績を出しているよ。特に、見たことがないツールセットを使う「ゼロショット」の設定でも、すごく高い精度を維持できているのが強みだね。

これがあれば、AIがもっといろんなことを自動でやってくれるようになるってことだよね！未来が明るい気がする！

そうだね。ただ、課題もある。何度も検索を繰り返すから、その分時間がかかる可能性があるし、プランニング自体が間違ってると変な方向に進んじゃうこともあるんだ。

なるほどねー。じゃあ、私の「失くした靴下を見つけるツール」も、このTOOLQPで検索すれば見つかるかな？

それはAPIじゃなくて、君の部屋を片付ける物理的な努力が必要だよ。……まずは自分の行動をプランニングしなよ。

投稿日:AI