6月 24 2024 0 誤答データでAIの数学推論能力が8倍に! 投稿者: ユウ 解説 智也くん、この論文のタイトル「RL on Incorrect Synthetic Data Scales the Efficiency of LLM Math Reasoning by Eight-Fold」ってす…