Adversarial Feedback - 亜美と智也のAI論文解説

4月 17 2024

敵対的フィードバックとAIの学習

投稿者: ユウ

解説ねえ智也くん、この論文のタイトル「敵対的フィードバックからの文脈的決闘バンディットのほぼ最適アルゴリズム」って何のこと？ああ、これはAIが人間のフィードバックを学習する際に、敵対者が意図的に誤った情報を提供するこ…