12月 25 2025 0 AIの評価は数字だけじゃない!「ノイズ」を見極めて小さな進歩も見逃さない方法 投稿者: ユウ 解説 ねえねえ、智也くん!これ見て!『Measuring all the noises of LLM Evals』って論文のタイトル、なんかすごく気になる! ああ、それか。メタの研究者が書いた論文だね。LLMの評価実験に…