12月 07 2024 0 動画理解と生成の未来を切り開く! 投稿者: ユウ 解説 ねえ、トモヤ!この論文のタイトル「Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation」って面白そうだね!内容を教えてくれ…
6月 30 2024 0 音楽ステム挿入のためのサブトラクティブトレーニング:新しい創造性の可能性 投稿者: ユウ 解説 智也くん、この「音楽ステム挿入のためのサブトラクティブトレーニング」っていう論文、面白そう!教えてくれない? もちろんだよ、亜美さん。この論文は、既存の音楽トラックに新しい楽器のパートを追加するための新しい手法につ…
6月 19 2024 0 拡散モデルと大規模言語モデルの新しい可能性を探る 投稿者: ユウ 解説 智也くん、この論文のタイトル「拡散モデルのプロンプトエンコーディングにおける大規模言語モデルの役割を探る」って面白そう!教えてくれる? もちろんだよ、亜美さん。この論文は、大規模言語モデル(LLM)を使って、テキス…