7月 31 2024 0 忘却を防ぐ新しい方法!MoFOの魅力とは? 投稿者: ユウ 解説 ねえ、トモヤ!この「MoFO: Momentum-Filtered Optimizer」っていう論文、面白そうだね!内容教えてくれない? もちろん。最近の大規模言語モデル(LLM)はすごい能力を持ってるんだけど、フ…
6月 04 2024 0 リスナーを意識した自信度調整:LACIEの紹介 投稿者: ユウ 解説 智也くん、この「LACIE: Listener-Aware Finetuning for Confidence Calibration in Large Language Models」っていう論文、面白そう!教え…
5月 10 2024 0 AIが新しいことを学ぶときのリスクとは? 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル見て興味がわいたんだけど、「LLMのファインチューニングで新しい知識を学ぶと幻覚を引き起こすの?」って、どういう意味? ああ、それはね、大規模言語モデルが新しい事実情報に遭遇すると、…
5月 06 2024 0 AIが解く!巡回セールスマン問題の新たな挑戦 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル「巡回セールスマン問題における大規模言語モデルの探索:GPT-3.5 Turboを用いたケーススタディ」って何がすごいの? ああ、これはね、AIがどうやって複雑な数学的問題を解決でき…
5月 02 2024 0 AIが教育を変える?自動採点とフィードバックの未来 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル見て興味が湧いたんだけど、「大規模言語モデルを使った自動採点とフィードバックについての調査」って、どういう内容なの? ああ、これはね、教育分野での自動採点とフィードバック生成を、最新…
4月 27 2024 0 医療ビジュアル言語モデルのファインチューニングについて 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル見て興味が湧いたんだけど、「LayerNormを使った医療ビジュアル言語モデルのファインチューニング」ってどういう意味? ああ、それはね、医療画像と言語データを組み合わせたAIモデル…
4月 12 2024 0 LLoCO: オフラインで長い文脈を学習する 投稿者: ユウ 解説 ねえ智也くん、この論文のタイトル「LLoCO: Learning Long Contexts Offline」って何か面白そう!何について書かれてるの? これは、大規模言語モデルが長い文脈を効率的に処理する方法につ…