3月 06 2026 0 POET-X:メモリ効率を大幅改善し、単一GPUで大規模言語モデルの学習を可能にする新手法 投稿者: ユウ TL;DR POET-Xは、学習安定性に優れるPOETアルゴリズムのメ…
3月 06 2026 0 自動運転評価のための合成環境画像の現実感を大規模評価する手法:生成AIがルールベースを大きく上回る 投稿者: ユウ TL;DR 自動運転システムの評価に必要な、霧・雨・雪・夜間などの環境…
3月 05 2026 0 LLMは人間レベルのコードリファクタリングを発見・実行できるか?CODETASTEベンチマークで検証 投稿者: ユウ TL;DR CODETASTEベンチマークの実験結果によると、最先端L…
3月 05 2026 0 Text-to-SQL評価の精度を高める新手法:データベース制約を活用した検証ツールSpotIt+ 投稿者: ユウ TL;DR Text-to-SQLシステムの評価で、従来のテスト実行ベ…