9月 17 2024 0 長いコンテキストを速くする!RetrievalAttentionの秘密 投稿者: ユウ 解説 ねえ、トモヤ!『RetrievalAttention』っていう論文のタイトルを見たんだけど、何か面白そうだね!内容を教えてくれない? もちろん!この論文は、長いコンテキストを持つ大規模言語モデル(LLM)の推論を速…