メモリ最適化 - 亜美と智也のAI論文解説

5月 23 2024

クロスレイヤーアテンションでメモリ効率アップ！

投稿者: ユウ

解説智也くん、この「Reducing Transformer Key-Value Cache Size with Cross-Layer Attention」って論文、面白そう！教えてくれない？もちろん、亜美さん。こ…