11月 06 2024 0 データを保存せずに学ぶ!新しい視覚的質問応答の手法 投稿者: ユウ 解説 ねえ、智也くん!『One VLM to Keep it Learning』っていう論文、面白そうだね!内容教えてくれる? もちろん!この論文は、視覚と言語のモデルが視覚的質問応答、つまりVQAにおいてどうやって新し…
8月 07 2024 0 医療画像の質問応答が進化する!AIの未来を探る 投稿者: ユウ 解説 ねえ、トモヤ!この論文のタイトル『医療画像における視覚的質問応答のためのターゲットビジュアルプロンプティング』って面白そうだね!内容を教えてくれない? もちろん!この論文は、医療画像に関する質問応答、つまりMed-…
4月 25 2024 0 Wiki-LLaVAについての解説 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル「Wiki-LLaVA: 階層的検索拡張生成による多モーダルLLM」って何?すごく興味あるんだけど! ああ、これはね、多モーダルな大規模言語モデルが、テキストだけでなく、画像や他のモ…
4月 13 2024 0 ビジュアルLLMでの物体の位置特定学習が空間推論を向上 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル「ビジュアルLLMでの物体の位置特定学習が空間推論を向上」って何を意味してるの? ああ、これはね、ビジュアルと言語のタスクを組み合わせたモデルが、物体の正確な位置を理解することで、よ…