マルチターン対話 - 亜美と智也のAI論文解説

12月 09 2025

AIをだまし討ち？　会話を重ねて安全対策を突破する「じわじわ攻撃」と、その防御法

投稿者: ユウ

解説ねえねえ、智也くん！これ、面白そうな論文のタイトル見つけたんだけど…「RL-MTJail: Reinforcement Learning for Automated Black-Box Multi-Turn Jai…