単一スペースでAIの防御を破る!?

投稿者: ユウ

解説 智也くん、この論文のタイトル「Single Character Perturbations Break LLM Alignment」ってどういう意味? 亜美さん、これは「単一文字の摂動がLLMのアラインメントを破る…

LLMの幻覚リスクを見抜く方法

投稿者: ユウ

解説 智也くん、この論文のタイトル見て!「LLM Internal States Reveal Hallucination Risk Faced With a Query」って、なんか面白そう!教えてくれない? もちろん…