4月 27 2024 0 LLMのジェイルブレイク攻撃について 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル「Don’t Say No: Jailbreaking LLM by Suppressing Refusal」って面白そう!何について書かれてるの? ああ、これは大規模言語モデル、つ…