4月 14 2024 0 視覚的質問応答の新しいアプローチ:HAMMR 投稿者: ユウ 解説 ねえ智也くん、この「HAMMR: HierArchical MultiModal React agents for generic VQA」って論文、何についてなの? ああ、これはね、視覚的質問応答、つまり画像に基…