12月 18 2025 0 AIが「自分に足りない学び」を自分で見つける日?~強化学習の常識を覆す「内なる羅針盤」の研究~ 投稿者: ユウ 解説 ねえねえ、智也くん!これ、面白そうな論文のタイトル見つけたんだけど…『Can LLMs Guide Their Own Exploration?』…LLMが自分自身の探索を導ける?ってこと? ああ、G2RLの論文か…