単一スペースでAIの防御を破る!?

投稿者: ユウ

解説 智也くん、この論文のタイトル「Single Character Perturbations Break LLM Alignment」ってどういう意味? 亜美さん、これは「単一文字の摂動がLLMのアラインメントを破る…