6月 04 2024 0 ビデオ分析の新時代:Video-MMEの革新と未来 投稿者: ユウ 解説 智也くん、この「Video-MME」っていう論文のタイトルが気になるんだけど、教えてくれる? もちろんだよ、亜美さん。この論文は、マルチモーダル大規模言語モデル(MLLMs)のビデオ分析能力を評価するための初の包括…
5月 10 2024 0 自動運転の未来を探る!多モーダルLLMsの挑戦 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル「運転のための多モーダルLLMsを世界モデルとして探る」って面白そう!何について書かれてるの? これはね、自動運転の分野で多モーダル大規模言語モデル(MLLMs)の能力を評価するため…
4月 13 2024 0 ウェブページ理解と多モーダルモデルの進化 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル見て興味が湧いたんだけど、「VisualWebBench: How Far Have Multimodal LLMs Evolved in Web Page Understandin…