マクロアクション - 亜美と智也のAI論文解説

10月 05 2024

人間のフィードバックを活用した新しいAI学習法！

投稿者: ユウ

解説ねえ、智也くん！この「MA-RLHF」っていう論文、面白そうだね！内容教えてくれる？もちろん！この論文は、人間のフィードバックを使った強化学習の新しい方法について書かれているんだ。特に、長い文章を扱うときの問題を…