言語モデルジェイルブレイクの評価方法を再考する

投稿者: ユウ

解説 ねえ智也、この論文のタイトル見て興味深いんだけど、内容教えてくれない?「言語モデルジェイルブレイクの評価方法を再考する」って、どういうこと? うん、この論文はね、大規模言語モデルが安全でない応答をしないようにするた…