4月 17 2024 0 敵対的フィードバックとAIの学習 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル「敵対的フィードバックからの文脈的決闘バンディットのほぼ最適アルゴリズム」って何のこと? ああ、これはAIが人間のフィードバックを学習する際に、敵対者が意図的に誤った情報を提供するこ…