AIの脳を壊さずに知識だけをサクサク書き換える！最強の編集術『CrispEdit』

2月 18 2026

解説

ねえねえ智也くん！この『CrispEdit』って論文、名前がなんだか美味しそうだね！サクサクのクッキーか何かのお話？

いや、全然違う。これはLLMの知識を書き換える「モデル編集」の新しいアルゴリズムの名前だよ。サクサクなのは計算の効率の方だね。

モデル編集？AIの記憶をちょっといじるってこと？

そう。例えば、古いニュースを新しい事実に書き換えたり、間違った知識を直したりすることだ。でも、これまでは一部を書き換えると、なぜかAI全体の頭が悪くなっちゃうっていう大きな悩みがあったんだ。

あー、あるある！一つのことを覚えると、昨日覚えたことを忘れちゃうみたいな感じ？

まあ、人間に例えればそうかもね。専門用語では「能力の劣化」って言うんだけど、この論文はそれを防ぐために『低曲率射影』っていう数学的なテクニックを使っているんだ。

ていきょく……？曲がってるのが低いの？

簡単に言うと、AIの能力を「地形」に例えるんだ。急な崖（高曲率）の方向にパラメータを動かすと能力が激変して壊れちゃうけど、平坦な道（低曲率）に沿って動かせば、能力を保ったまま知識だけを変えられる。その「平坦な道」を見つけて、そこに更新を制限（射影）するのがCrispEditの肝だよ。

なるほど！崖から落ちないように、平らな道だけを選んでお散歩するってことだね！でも、その道はどうやって見つけるの？

そこで「Bregmanダイバージェンス」と「ガウス・ニュートン・ヘッセ行列（GNH）」っていう道具を使う。これを使うと、モデルが学習の途中でまだ完璧に賢くなっていない状態でも、どの方向が「壊れやすい道」なのかを正確に計算できるんだ。

うう、呪文みたい……。でも、LLMってすごく巨大でしょ？そんな難しい計算、時間がかかって日が暮れちゃうんじゃない？

鋭いね。普通にやると巨大な行列が必要でメモリが足りなくなる。だからこの論文では「K-FAC」っていう近似手法と、行列をわざわざ作らずに計算する「マトリックスフリー」な手法を組み合わせて、めちゃくちゃ高速化してるんだ。3000件の編集がたった6分で終わるらしいよ。

6分！カップラーメン2個分だ！それで、本当にAIはバカにならなかったの？

実験結果によると、Llama-3とかのモデルで試して、一般能力の低下は平均で1%未満だったそうだ。他の有名な手法だと、知識は書き換えられても推論能力がガタ落ちしたりするんだけど、CrispEditはそれを高いレベルで両立させているんだよ。

すごーい！これがあれば、AIにどんどん新しいことを教えても、ずっと賢いままなんだね。将来はどうなるの？

リアルタイムでニュースを学習させたり、ユーザーごとの好みに合わせてAIをカスタマイズしたりするのが、もっと安全にできるようになるだろうね。ただ、まだ「どのデータを能力保持のために使うか」という選び方の課題はあるみたいだけど。

そっかぁ。じゃあ私の脳にもCrispEditして、昨日の失敗だけ忘れて、テストの知識だけサクサク詰め込んでほしいな！

亜美さんの場合は、低曲率の道を探す前に、まず学習データが足りてないんじゃないかな。

LLMの特定の知識を修正・更新する「モデル編集」において、編集後にモデルの一般的な推論能力や対話能力が低下してしまう「能力劣化」の問題を解決する手法を提案。
「CrispEdit」は、モデルの能力に影響を与えにくい「曲率の低い方向（平坦な道）」にのみパラメータの更新を制限することで、元の能力を維持したまま知識の書き換えを行う。
Bregmanダイバージェンスを用いることで、学習が完全に収束していないモデルでも正確に「能力を壊さない方向」を計算できる理論的な枠組みを構築した。
巨大なLLMでも計算できるように、K-FAC（行列分解）と行列を使わない射影手法を導入し、数千件の編集を数分で終わらせる高いスケーラビリティを実現。
Llama-3などの最新モデルを用いた実験で、編集の成功率を高く保ちつつ、一般能力の低下を1%未満に抑えるという、従来手法を大きく上回る成果を出した。

投稿日:AI