12月 23 2025 0 動画AIの遅延解消!複数GPUで“協力デコード”する画期的な方法 投稿者: ユウ 解説 ねえねえ、智也くん!これ、『GPU内部のスケジューリングとリソース共有による分離型多段階MLLM推論の実現』って論文、すごく難しそうなタイトルだけど、何か面白そうなことやってるの? ああ、この論文か。要するに、画像…
12月 18 2025 0 AIのスピード革命!「賢い仕分け」で文章生成がもっと速く、賢くなる 投稿者: ユウ 解説 ねえねえ、智也くん!これ、『Dynamic Rebatching for Efficient Early-Exit Inference with DREX』って論文、すごく難しそうなタイトルだけど、何か面白そうなこ…