AIの「忘れ物」をスマートに！必要なところだけ消去する新技術PALU

1月 08 2026

解説

ねえねえ智也くん！この『PALU』っていう論文のタイトル、「大事なところだけエントロピーを最大化する」って書いてあるけど、これってお部屋の片付けのコツか何かなの？

いや、全然違うよ。これはAI、特にLLMに特定の情報を忘れさせる『アンラーニング』っていう技術の話だ。亜美さんは、AIが個人情報とか著作権のあるデータを覚えちゃってるのが問題になってるって聞いたことない？

あ、ニュースで見たことある！勝手に誰かの住所を教えちゃったりしたら大変だもんね。でも、一度覚えたことを忘れさせるのって難しいんじゃない？

その通り。今までのやり方だと、特定の情報を消そうとすると、関係ない知識まで一緒に消えちゃって、AIがバカになっちゃうことが多かったんだ。例えるなら、ノートの1行を消したいだけなのに、ページ全体を真っ白にしちゃうような感じかな。

それは困るね！せっかく賢いAIなのに。この論文はどうやってそれを解決したの？

この論文の面白いところは、2つの『サボりポイント』を見つけたことなんだ。1つ目は『時間的スパース性』。機密情報を話し始める最初の数単語、つまり『出だし』さえ邪魔すれば、AIはその後の内容を生成できなくなるって気づいたんだよ。

なるほど！「昔々……」って言いかけたところで口を塞いじゃえば、桃太郎の話は始まらないってことだね！

例えは変だけど、まあ合ってるよ。2つ目は『語彙的スパース性』。AIが次に言う単語を選ぶとき、実は候補になるのは上位の数個だけなんだ。だから、何万個もある全単語をいじるんじゃなくて、上位の候補だけをめちゃくちゃに迷わせればいいんだよ。

迷わせる？それがタイトルにあった『エントロピーを最大化する』ってこと？

そう。エントロピーっていうのは『不確かさ』の指標なんだ。特定の単語の確率を下げるんじゃなくて、上位候補の確率を全部同じくらいにして「どれを選べばいいか分からない！」っていう状態にする。これが『局所的なエントロピー最大化』だね。

へぇー！全部を消すんじゃなくて、大事なところだけ「うーん、どれかな？」って迷わせるだけでいいんだ。賢いね！

実験結果でも、このPALUっていう手法は、他の方法よりもしっかり情報を消せているし、AIの元々の賢さもほとんど落ちなかったんだ。計算量も少なくて済むから、すごく効率的なんだよ。

すごい！これがあれば、AIをもっと安全に使えるようになるね。将来はどうなっていくのかな？

プライバシー保護の法律も厳しくなってるから、こういう『忘れさせる技術』は必須になるはずだ。ただ、まだ課題もあって、どの単語が『機密情報の出だし』なのかを正確に見つけるのが少し難しいんだよね。そこは今後の研究課題かな。

そっかぁ。じゃあ、私のテストの悪い点数も、お母さんが見る前にその『出だし』だけアンラーニングして迷わせることはできないかな？

それはAIじゃなくて亜美さんの記憶と、お母さんの目の前の現実の問題でしょ。勉強して上書きしなさい！

投稿日:AI