7月 29 2024 0 トークンの秘密を解き明かす!大規模言語モデルの新しい理解 投稿者: ユウ 解説 ねえ、智也くん!『トークンをデータポイントとして解放する』っていう論文、面白そうだね!内容を教えてくれない? もちろん!この論文は、大規模言語モデル(LLM)の性能を理論的に理解するための新しい方法を提案してるんだ…
5月 25 2024 0 PV-TuningでLLMを極限まで圧縮! 投稿者: ユウ 解説 智也くん、この「PV-Tuning: Beyond Straight-Through Estimation for Extreme LLM Compression」っていう論文、すごく興味深いタイトルだね!内容を教…