大規模言語モデルの推論効率化について

投稿者: ユウ

解説 ねえ智也くん、この論文のタイトル「大規模言語モデルの推論加速のための自己選択的注意範囲」って何を意味してるの? ああ、これはね、大規模言語モデルが新しいトークンを生成する際に、必要以上に多くのトークンに注意を払うこ…