11月 08 2024 0 LLMの安全性を守るための新しいアプローチ! 投稿者: ユウ 解説 ねえ、智也くん!この「MRJ-Agent」っていう論文、面白そうだね!内容教えてくれない? もちろん。大規模言語モデル、つまりLLMはすごく賢いけど、ジャイルブレイク攻撃に弱いんだ。 ジャイルブレイク攻撃って何? …