12月 21 2024 0 多言語の安全性を守る新しい挑戦! 投稿者: ユウ 解説 ねえ、トモヤ!この論文のタイトル「LLMs Lost in Translation: M-ALERT uncovers Cross-Linguistic Safety Gaps」って面白そうだね!内容を教えてくれる…
12月 20 2024 0 自動運転の信頼性を考える!AUTOTRUSTの魅力 投稿者: ユウ 解説 ねえ、トモヤ!この『AUTOTRUST』っていう論文、面白そうだね!内容教えてくれない? もちろん。AUTOTRUSTは、自動運転のための大規模な視覚言語モデルの信頼性を評価するためのベンチマークなんだ。 信頼性っ…
12月 05 2024 0 AIの安全性を脅かす新手法?BoN Jailbreakingの秘密 投稿者: ユウ 解説 ねえ、トモヤ!この「Best-of-N Jailbreaking」っていう論文、面白そうだね!内容教えてくれない? もちろん。BoN Jailbreakingは、AIシステムの安全対策を回避するための新しい手法なん…
11月 30 2024 0 自動運転の未来を守るための敵対的攻撃の研究 投稿者: ユウ 解説 ねえ、トモヤ!この論文のタイトル『自動運転のための視覚的敵対的攻撃』って面白そうだね!内容を教えてくれない? もちろん。自動運転に使われる視覚と言語のモデル、つまりVLMは、運転の判断を助けるんだけど、敵対的攻撃に…
11月 28 2024 0 信頼できないAIモデルの安全性を守る新しいアプローチ 投稿者: ユウ 解説 ねえ、智也くん!『信頼できないLLMの適応的展開が分散脅威を減少させる』っていう論文、面白そうだね!内容を教えてくれない? もちろん!この論文は、大規模言語モデル(LLM)が安全対策を回避しようとする可能性について…
11月 25 2024 0 生成的人工知能で自動運転車の安全性を高める! 投稿者: ユウ 解説 ねえ、智也くん!この論文のタイトルが面白そうなんだけど、教えてくれない? もちろん!この論文は、自動運転車の安全性を確保するために、生成的人工知能を使って故障木分析を行う方法について書かれているんだ。 故障木分析っ…
11月 25 2024 0 軽量なAIガードレールの未来を探る! 投稿者: ユウ 解説 ねえ、トモヤくん!『軽量な安全ガードレールを使った微調整されたBERT埋め込み』っていう論文、面白そうだね!内容を教えてくれる? もちろん!最近、LLMが普及してきて、企業がプロトタイプを作るのが簡単になったんだけ…
11月 08 2024 0 LLMの安全性を守るための新しいアプローチ! 投稿者: ユウ 解説 ねえ、智也くん!この「MRJ-Agent」っていう論文、面白そうだね!内容教えてくれない? もちろん。大規模言語モデル、つまりLLMはすごく賢いけど、ジャイルブレイク攻撃に弱いんだ。 ジャイルブレイク攻撃って何? …
11月 05 2024 0 ドローンとAIの安全性:未来の技術を守るために 投稿者: ユウ 解説 ねえ、智也くん!この論文のタイトル『大規模言語モデルの物理的安全性の定義と評価』って面白そうだね!内容を教えてくれない? もちろん。最近、大規模言語モデル(LLM)がドローンの制御に使われることが増えてきたんだけど…
10月 16 2024 0 モデルをマージして安全性を高める! 投稿者: ユウ 解説 ねえ、智也くん!『データを混ぜるか、モデルをマージするか?多様なマルチタスク学習の最適化』っていう論文、面白そうだね!内容教えて! ああ、それは面白いテーマだよ。大規模言語モデルは多くのタスクに使われているけど、安…