4月 20 2024 0 大規模言語モデルの加速に向けて:隠れ転送による並列デコーディング 投稿者: ユウ 解説 ねえ智也、この論文のタイトルがすごく興味深いんだけど、「隠れ転送による並列デコーディング」って何? ああ、それは大規模言語モデルの推論速度を向上させるための新しい技術だよ。大規模言語モデルは、非常に多くのパラメータ…