マルチモーダルAI - 亜美と智也のAI論文解説 - Page 26

4月 17 2024

0

自動運転のコーナーケースにおける視覚言語モデルの評価

投稿者: ユウ

解説ねえ智也、この論文のタイトル見て興味が湧いたんだけど、「自動運転…

4月 17 2024

0

画像からのプライベート属性推論について

投稿者: ユウ

解説ねえ智也くん、この論文のタイトル「画像からのプライベート属性推論…

4月 15 2024

0

放射線学における画像テキストペアの拡張

投稿者: ユウ

解説ねえ智也くん、この「PairAug: 放射線学で拡張された画像テ…

4月 15 2024

0

VLM-LLM特徴を用いた進行的アライメントでの欠陥分類の拡張についての解説

投稿者: ユウ

解説ねえ智也、この論文のタイトル「VLM-LLM特徴を用いた進行的ア…

4月 12 2024

0

音声理解のための新しいデータセット「Audio Dialogues」について

投稿者: ユウ

解説ねえ智也くん、この「Audio Dialogues」という論文の…

4月 12 2024

0

テキストから画像への生成モデルのバイアス検出について

投稿者: ユウ

解説ねえ智也くん、この「OpenBias: テキストから画像への生成…

4月 10 2024

0

MoMA: パーソナライズされた画像生成の未来

投稿者: ユウ

解説ねえ智也、この「MoMA: Multimodal LLM Ada…

4月 08 2024

0

テキストから画像への忠実度評価

投稿者: ユウ

解説ねえ智也、この論文のタイトル、なんか面白そう！「評価を評価する人…

4月 06 2024

0

RALL-E: テキストから音声合成への新しいアプローチ

投稿者: ユウ

解説ねえ智也くん、この「RALL-E: テキストから音声合成における…

4月 06 2024

0

LongVLMによる長いビデオ理解

投稿者: ユウ

解説ねえ智也、この「LongVLM: Efficient Long …