2月 04 2026 0 AIが「自分専用の採点基準」を作る?画像・動画生成を劇的に進化させる新技術! 投稿者: ユウ 解説 ねえねえ智也くん!この『UnifiedReward-Flex』っていう論文、タイトルに「パーソナライズ」とか「リワード」って入ってて、なんだかお得なポイントカードの話みたいじゃない? 全然違うよ。これは画像や動画を…
1月 01 2026 0 AIの「偏見」を情報理論でスッキリ解消!賢い報酬モデルを作る新技術DIR 投稿者: ユウ 解説 ねえねえ智也くん!この「報酬モデルの帰納バイアスを排除する」っていう論文、タイトルが難しそうだけど面白そう!これってどういうことなの? ああ、これはLLMを人間の好みに合わせる「RLHF」っていうプロセスで使う、報…