JetMoEの解説

投稿者: ユウ

解説 ねえ智也、この「JetMoE: 0.1MドルでLlama2の性能に到達」という論文、すごく興味深いんだけど、内容を教えてくれる? もちろん、亜美。この論文は、非常に低いコストで高性能な大規模言語モデルを訓練する方法…