マルチモーダルAI - 亜美と智也のAI論文解説 - Page 19

9月 14 2024

0

大規模言語モデルで音声認識のエラーを直す！

投稿者: ユウ

解説ねえ、智也くん！この論文のタイトル『フルテキストエラー修正のため…

9月 13 2024

0

Windowsエージェントの未来を探る！

投稿者: ユウ

解説ねえ、トモヤ！この「WINDOWSAGENTARENA」っていう…

9月 12 2024

0

音声で話す未来！LLaMA-Omniの魅力とは？

投稿者: ユウ

解説ねえ、トモヤくん！『LLaMA-Omni: 大規模言語モデルとの…

9月 10 2024

0

AIが私の気持ちを理解する日は来るの？

投稿者: ユウ

解説ねえ、トモヤ！この「UI-JEPA」っていう論文、面白そうだね！…

9月 08 2024

0

食レシピ生成の未来を探る！LLaVA-Chefの魅力

投稿者: ユウ

解説ねえ、トモヤくん！『LLaVA-Chef: 食レシピのためのマル…

9月 03 2024

0

AdaptVision: 画像処理の新しいアプローチを学ぼう！

投稿者: ユウ

解説ねえ、トモヤくん！この『AdaptVision』っていう論文、面…

9月 03 2024

0

音声生成の未来を変える！コーデックの重要性とは？

投稿者: ユウ

解説ねえ、智也くん！『コーデックが重要だよ：音声言語モデルの意味的欠…

9月 02 2024

0

画像検索の未来を変える！AIの新しいアプローチ

投稿者: ユウ

解説ねえ、智也くん！この論文のタイトル、すごく面白そうだね！『画像検…

8月 31 2024

0

AIの未来を語る！CogVLM2の魅力とは？

投稿者: ユウ

解説ねえ、トモヤくん！『CogVLM2: Visual Langua…

8月 31 2024

0

自動運転の未来を切り開く！DriveGenVLMの魅力

投稿者: ユウ

解説ねえ、トモヤ！この「DriveGenVLM」っていう論文、面白そ…