4月 16 2024 0 大規模言語モデルのためのRadial Networks 投稿者: ユウ 解説 ねえ智也くん、この「Radial Networks: Dynamic Layer Routing for High-Performance Large Language Models」って論文、何について書かれてる…