コードモデルの評価基準を考える!

投稿者: ユウ

解説 ねえ、智也くん!この『ComplexCodeEval』っていう論文、面白そうだね!内容教えてくれない? もちろん。最近、コード関連のタスクに大規模言語モデルが使われることが増えてきたんだけど、既存の評価基準は特定の…

LLMの幻覚を解明する!

投稿者: ユウ

解説 ねえ、智也くん!『WILDHALLUCINATIONS』っていう論文、面白そうだね!内容教えてくれない? もちろん。大規模言語モデル、つまりLLMが生成する情報の正確性が大きな課題になってるんだ。特に、幻覚って言っ…