1月 21 2026 0 AIのカンニングを見破れ!デタラメな報酬で賢くなる謎を解明 投稿者: ユウ 解説 ねえねえ智也くん!この「偽りの報酬パラドックス」っていう論文のタイトル、なんかカッコよくない?デタラメな報酬で賢くなるってどういうこと? ああ、それね。普通、AIの強化学習って正しい答えに報酬をあげることで賢くする…