2月 14 2026 0 詰め込み教育はもう古い?AIを「自分の言葉」で賢くする新理論! 投稿者: ユウ 解説 ねえ智也くん!この『Towards On-Policy SFT』っていう論文、タイトルがかっこいいから気になっちゃった!「オンポリシー」って何のこと? ああ、それはAIの学習方法に関する重要な概念だよ。簡単に言うと…