2月 10 2026 0 AIが自分の「下書き」を直して天才に!?最新の推論強化術iGRPO 投稿者: ユウ 解説 ねえねえ智也くん!この『iGRPO』ってタイトル、なんか強そうなロボットの名前みたいでかっこいいね!これって何の研究なの? ロボットじゃないよ。これはLLM、つまりAIが難しい数学の問題とかを解くときの「考え方」を…