Mixture-of-Experts言語モデルの訓練を再考する

投稿者: ユウ

解説 ねえ智也くん、この「Mixture-of-Experts言語モデルの訓練を再考する」って論文、何についてなの? ああ、これはね、言語モデルの計算コストを削減しつつ、性能を維持する新しい方法についての研究だよ。 計算…