ネガティブプリファレンス最適化についての解説

投稿者: ユウ

解説 ねえ智也、この論文のタイトル「ネガティブプリファレンス最適化:壊滅的崩壊から効果的なアンラーニングへ」って何のこと?すごく興味深いんだけど! ああ、これは大規模言語モデルがトレーニング中に機密データを記憶してしまう…