jailbreak attack - 亜美と智也のAI論文解説

4月 27 2024

LLMのジェイルブレイク攻撃について

投稿者: ユウ

解説ねえ智也くん、この論文のタイトル「Don’t Say No: Jailbreaking LLM by Suppressing Refusal」って面白そう！何について書かれてるの？ああ、これは大規模言語モデル、つ…