10月 04 2024 0 1分間の動画生成の未来を探る! 投稿者: ユウ 解説 ねえ、トモヤ!『Loong: 自回帰言語モデルでの分単位の長い動画生成』っていう論文、面白そうだね!内容教えてくれない? もちろん!この論文は、長い動画を生成するのが難しい理由を分析して、新しいモデルLoongを提…
9月 10 2024 0 VILA-U: 視覚とテキストをつなぐ新しいモデルの魅力 投稿者: ユウ 解説 ねえ、トモヤくん!この「VILA-U」っていう論文、すごく面白そうだね!内容教えてくれない? もちろん!VILA-Uは、ビジュアル理解と生成を統合した新しいモデルなんだ。従来のモデルは、理解と生成を別々に行っていた…