LLMのジェイルブレイク攻撃について

投稿者: ユウ

解説 ねえ智也くん、この論文のタイトル「Don’t Say No: Jailbreaking LLM by Suppressing Refusal」って面白そう!何について書かれてるの? ああ、これは大規模言語モデル、つ…