7月 07 2024 0 自己評価でLLMを守る!敵対的攻撃に対する新しい防御策 投稿者: ユウ 解説 智也くん、この論文のタイトルを見たんだけど、「LLMに対する敵対的攻撃に対する自己評価を利用した防御策」って何のことか教えてくれる? もちろんだよ、亜美さん。この論文は、大規模言語モデル(LLM)が敵対的攻撃を受け…