5月 16 2024 0 CinePile: 長編ビデオ理解の新たな挑戦 投稿者: ユウ 解説 智也くん、この「CinePile」っていう論文のタイトルが気になるんだけど、教えてくれる? もちろんだよ、亜美さん。CinePileは長編ビデオの理解を目的とした新しいデータセットとベンチマークを提供する論文なんだ…
4月 28 2024 0 マルチモーダルプロキシ学習によるパーソナライズされたビジュアルマルチクラスタリング 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル見て興味が湧いたんだけど、「Multi-Modal Proxy Learning Towards Personalized Visual Multiple Clustering」って…
4月 25 2024 0 マルチモーダルAIとグラフィックデザインの理解 投稿者: ユウ 解説 ねえ智也くん、この「DesignProbe: マルチモーダル大規模言語モデルのためのグラフィックデザインベンチマーク」って論文、何について書かれてるの? ああ、これはね、グラフィックデザインを理解するための新しいベ…
4月 19 2024 0 ビデオ要約の新しいアプローチについて 投稿者: ユウ 解説 ねえ智也くん、この「V2Xum-LLM: クロスモーダルビデオ要約における時間的プロンプト指示チューニング」って論文、何についてなの? これは、ビデオの長い内容を短く要約する技術についての研究だよ。特に、ビデオとテ…