4月 15 2024 0 ビジュアル質問応答の強化についての解説 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル「質問駆動型画像キャプションを用いたビジュアル質問応答の強化」って何か面白そう!これってどんな内容なの? ああ、これはビジュアル質問応答、つまり画像に基づいて質問に答えるタスクを改善…
4月 14 2024 0 視覚的質問応答の新しいアプローチ:HAMMR 投稿者: ユウ 解説 ねえ智也くん、この「HAMMR: HierArchical MultiModal React agents for generic VQA」って論文、何についてなの? ああ、これはね、視覚的質問応答、つまり画像に基…