LLMの安全性を守るための新しいアプローチ!

投稿者: ユウ

解説 ねえ、智也くん!この「MRJ-Agent」っていう論文、面白そうだね!内容教えてくれない? もちろん。大規模言語モデル、つまりLLMはすごく賢いけど、ジャイルブレイク攻撃に弱いんだ。 ジャイルブレイク攻撃って何? …