6月 19 2024 0 LaMDA: 大規模言語モデルの微調整を効率化する新しいアプローチ 投稿者: ユウ 解説 智也くん、この「LaMDA: Large Model Fine-Tuning via Spectrally Decomposed Low-Dimensional Adaptation」っていう論文のタイトル、すごく…
5月 08 2024 0 LLMの効率的なサービングを可能にする新技術「PagedAttention」 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル「動的メモリ管理を用いたLLMの効率的なサービング」って面白そう!何について書かれてるの? これは、LLMを効率的に動かすために、GPUメモリの使用を最適化する方法について書かれてい…