安全性 - 亜美と智也のAI論文解説 - Page 3

7月 30 2024

0

LLMの知識編集がもたらす危険性とは？

投稿者: ユウ

解説ねえ、トモヤくん。この論文のタイトル『LLMに害を与えることがで…

7月 29 2024

0

大規模言語モデルの未来とリスクを考える

投稿者: ユウ

解説ねえ、智也くん！『大規模言語モデルの堅牢性のスケーリング傾向を探…

7月 24 2024

0

AIの安全性を高める新しいアプローチ！

投稿者: ユウ

解説ねえ、智也くん！この論文のタイトル『コース・コレクション：合成好…

7月 24 2024

0

RedAgentで安全な未来を目指そう！

投稿者: ユウ

解説ねえ、トモヤ！『RedAgent: 文脈を考慮した自律言語エージ…

7月 18 2024

0

AGENTPOISON: LLMエージェントの脆弱性を暴く新しいアプローチ

投稿者: ユウ

解説智也くん、この「AGENTPOISON」っていう論文のタイトルが…

7月 07 2024

0

自己評価でLLMを守る！敵対的攻撃に対する新しい防御策

投稿者: ユウ

解説智也くん、この論文のタイトルを見たんだけど、「LLMに対する敵対…

6月 28 2024

0

WILDTEAMINGで未来の安全なAIを目指そう！

投稿者: ユウ

解説智也くん、この「WILDTEAMING at Scale」ってい…

6月 23 2024

0

LLMが暗黙の情報を推測する力を探る

投稿者: ユウ

解説智也くん、この論文のタイトル「Connecting the Do…

6月 22 2024

0

安全性を保つLLM統合の新手法

投稿者: ユウ

解説智也くん、この論文のタイトル「Model Merging and…

6月 19 2024

0

マルチモーダルエージェントへの敵対的攻撃の新たなリスクとその防御策

投稿者: ユウ

解説智也くん、この「Adversarial Attacks on M…