大規模言語モデルの安全性について

投稿者: ユウ

解説 ねえ智也くん、この「SafetyPrompts: 大規模言語モデルの安全性を評価・改善するためのオープンデータセットに関する体系的レビュー」って論文、何について書かれてるの? ああ、これはね、大規模言語モデルの安全…

大規模言語モデルの安全性向上に向けて

投稿者: ユウ

解説 ねえ智也くん、この論文のタイトル「Eraser: Large Language Modelsの有害な知識をアンラーニングすることでジェイルブレイキング防御」って何?すごく興味深いけど、内容がよくわからないな。 ああ…