7月 24 2024 0 RedAgentで安全な未来を目指そう! 投稿者: ユウ 解説 ねえ、トモヤ!『RedAgent: 文脈を考慮した自律言語エージェントによる大規模言語モデルのレッドチーミング』っていう論文、面白そうだね!内容教えて! ああ、これは最近の大規模言語モデル(LLM)の安全性に関する…
6月 28 2024 0 WILDTEAMINGで未来の安全なAIを目指そう! 投稿者: ユウ 解説 智也くん、この「WILDTEAMING at Scale」っていう論文のタイトル、なんだか面白そう!教えてくれない? もちろん、亜美さん。この論文は、WILDTEAMINGという新しい自動レッドチーミングフレームワ…