人間のフィードバック - 亜美と智也のAI論文解説

12月 05 2024

0

トークンレベルの報酬でAIをもっと賢くする方法

投稿者: ユウ

解説ねえ、トモヤ！この「T-REG: Preference Opti…

10月 13 2024

0

AIの未来を変える！報酬強化データの力

投稿者: ユウ

解説ねえ、トモヤくん！この論文のタイトル『報酬強化データがLLMの直…

10月 05 2024

0

人間のフィードバックを活用した新しいAI学習法！

投稿者: ユウ

解説ねえ、智也くん！この「MA-RLHF」っていう論文、面白そうだね…

9月 09 2024

0

AIの好みを学ぶ？智也くんと亜美さんの楽しい対話

投稿者: ユウ

解説ねえ、智也くん！この論文のタイトル、すごく面白そうだね！『直接的…

4月 22 2024

0

多モード物理問題に答えるAIの解説

投稿者: ユウ

解説ねえ智也、この論文のタイトルが面白そう！「多モード物理問題に答え…