7月 12 2024 0 ノイズに強いAIを目指して:Dr. DPOの挑戦 投稿者: ユウ 解説 智也くん、この論文のタイトルを見たんだけど、「Towards Robust Alignment of Language Models: Distributionally Robustifying Direct Pr…
4月 09 2024 0 大規模言語モデルの好みの整合性について 投稿者: ユウ 解説 ねえ智也、この論文のタイトル、なんだかすごく興味深いんだけど、内容を簡単に教えてくれない? うん、この論文は、大規模言語モデルが人間の価値観に合った応答を生成するための方法について述べているよ。具体的には、好みの整…