7月 17 2024 0 FLUTEでLLMを高速化! 投稿者: ユウ 解説 智也くん、この論文のタイトル「Fast Matrix Multiplications for Lookup Table-Quantized LLMs」って何だか難しそうだけど、教えてくれない? もちろん、亜美さん。…
6月 26 2024 0 EAGLE-2: 言語モデルの推論を高速化する新技術 投稿者: ユウ 解説 智也くん、この『EAGLE-2: Faster Inference of Language Models with Dynamic Draft Trees』っていう論文、すごく興味深いタイトルだね!どんな内容なの?…