GPUメモリ - 亜美と智也のAI論文解説

6月 19 2024

0

LaMDA: 大規模言語モデルの微調整を効率化する新しいアプローチ

投稿者: ユウ

解説智也くん、この「LaMDA: Large Model Fine-…

5月 08 2024

0

LLMの効率的なサービングを可能にする新技術「PagedAttention」

投稿者: ユウ

解説ねえ智也くん、この論文のタイトル「動的メモリ管理を用いたLLMの…