敵対的攻撃 - 亜美と智也のAI論文解説

11月 30 2024

0

自動運転の未来を守るための敵対的攻撃の研究

投稿者: ユウ

解説ねえ、トモヤ！この論文のタイトル『自動運転のための視覚的敵対的攻撃』って面白そうだね！内容を教えてくれない？もちろん。自動運転に使われる視覚と言語のモデル、つまりVLMは、運転の判断を助けるんだけど、敵対的攻撃に…

10月 13 2024

0

投稿者: ユウ

解説ねえ、トモヤ！この論文のタイトル『LLMの敵対的ロバスト性の保証に向けたオントロジー駆動の議論』って面白そうだね！内容を教えてくれない？もちろん！この論文は、大規模言語モデル（LLM）が敵対的攻撃に対してどれだけ…

8月 31 2024

0

投稿者: ユウ

解説ねえ、トモヤ！この「PromptSmooth」っていう論文、面白そうだね！内容教えてくれない？もちろん。医療ビジョン・ランゲージモデル、つまりMed-VLMは、医療画像とテキストのペアを使って学習されるんだ。でも…

8月 07 2024

0

投稿者: ユウ

解説ねえ、智也くん！『SEAS: 自己進化型敵対的安全最適化』っていう論文、面白そうだね！内容教えてくれない？もちろん！この論文は、大規模言語モデルの安全性を確保するための新しいアプローチについて書かれているんだ。特…

8月 07 2024

0

投稿者: ユウ

解説ねえ、トモヤ！この論文のタイトル「強化学習がアライメントされた大規模言語モデルの隠れた危険を解き明かせるか？」って面白そうだね！内容を教えてくれない？もちろん！この論文は、大規模言語モデル（LLM）が自然言語のタ…

7月 07 2024

0

投稿者: ユウ

解説智也くん、この論文のタイトルを見たんだけど、「LLMに対する敵対的攻撃に対する自己評価を利用した防御策」って何のことか教えてくれる？もちろんだよ、亜美さん。この論文は、大規模言語モデル（LLM）が敵対的攻撃を受け…

6月 19 2024

0

投稿者: ユウ

解説智也くん、この「Adversarial Attacks on Multimodal Agents」って論文、面白そう！教えてくれない？もちろん、亜美さん。この論文は、視覚対応の大規模言語モデル（VLM）を使って自…

4月 23 2024

0

投稿者: ユウ

解説ねえ智也、この論文のタイトル「情報ボトルネックであなたのLLMを守る」って何のこと？ああ、これは大規模言語モデルが攻撃される問題に対処するための研究だよ。具体的には、敵対的なプロンプトによる攻撃からモデルを守る新…