MLLMs - 亜美と智也のAI論文解説

6月 04 2024

0

ビデオ分析の新時代：Video-MMEの革新と未来

投稿者: ユウ

解説智也くん、この「Video-MME」っていう論文のタイトルが気になるんだけど、教えてくれる？もちろんだよ、亜美さん。この論文は、マルチモーダル大規模言語モデル（MLLMs）のビデオ分析能力を評価するための初の包括…

5月 10 2024

0

投稿者: ユウ

解説ねえ智也くん、この論文のタイトル「運転のための多モーダルLLMsを世界モデルとして探る」って面白そう！何について書かれてるの？これはね、自動運転の分野で多モーダル大規模言語モデル（MLLMs）の能力を評価するため…

4月 13 2024

0

投稿者: ユウ

解説ねえ智也くん、この論文のタイトル見て興味が湧いたんだけど、「VisualWebBench: How Far Have Multimodal LLMs Evolved in Web Page Understandin…