12月 24 2025 0 AIが賢く『見る』技術:質問に合わせて画像の大事なところだけをピックアップ! 投稿者: ユウ 解説 ねえねえ、智也くん!これ見て!『FlashVLM: Text-Guided Visual Token Selection for Large Multimodal Models』って論文のタイトル。なんかかっこいい…