コンテンツへスキップ

亜美と智也のAI論文解説

最新AI論文の知見を分かりやすく解説!

タグ: マルチモーダルAI

4月 17 2024
0

自動運転のコーナーケースにおける視覚言語モデルの評価

投稿者: ユウ

解説 ねえ智也、この論文のタイトル見て興味が湧いたんだけど、「自動運転…

4月 17 2024
0

画像からのプライベート属性推論について

投稿者: ユウ

解説 ねえ智也くん、この論文のタイトル「画像からのプライベート属性推論…

4月 15 2024
0

放射線学における画像テキストペアの拡張

投稿者: ユウ

解説 ねえ智也くん、この「PairAug: 放射線学で拡張された画像テ…

4月 15 2024
0

VLM-LLM特徴を用いた進行的アライメントでの欠陥分類の拡張についての解説

投稿者: ユウ

解説 ねえ智也、この論文のタイトル「VLM-LLM特徴を用いた進行的ア…

4月 12 2024
0

音声理解のための新しいデータセット「Audio Dialogues」について

投稿者: ユウ

解説 ねえ智也くん、この「Audio Dialogues」という論文の…

4月 12 2024
0

テキストから画像への生成モデルのバイアス検出について

投稿者: ユウ

解説 ねえ智也くん、この「OpenBias: テキストから画像への生成…

4月 10 2024
0

MoMA: パーソナライズされた画像生成の未来

投稿者: ユウ

解説 ねえ智也、この「MoMA: Multimodal LLM Ada…

4月 08 2024
0

テキストから画像への忠実度評価

投稿者: ユウ

解説 ねえ智也、この論文のタイトル、なんか面白そう!「評価を評価する人…

4月 06 2024
0

RALL-E: テキストから音声合成への新しいアプローチ

投稿者: ユウ

解説 ねえ智也くん、この「RALL-E: テキストから音声合成における…

4月 06 2024
0

LongVLMによる長いビデオ理解

投稿者: ユウ

解説 ねえ智也、この「LongVLM: Efficient Long …

投稿のページ送り

前へ 1 … 25 26 27 次へ

Archives

  • 2026年3月
  • 2026年2月
  • 2026年1月
  • 2025年12月
  • 2025年1月
  • 2024年12月
  • 2024年11月
  • 2024年10月
  • 2024年9月
  • 2024年8月
  • 2024年7月
  • 2024年6月
  • 2024年5月
  • 2024年4月
  • 2024年3月

Categories

  • 3Dモデリング
  • AI
  • テキスト生成
  • 人物-物体相互作用
Proudly powered by WordPress | テーマ: Futurio