LLMエージェント - 亜美と智也のAI論文解説

7月 16 2026

0

評価指標も進化させるDouble Ratchet：LLMエージェント自己改善の信頼性を高める手法

投稿者: ユウ

TL;DR LLMエージェントの自己改善ループには信頼できる評価指標が…

7月 14 2026

0

CLIコーディングエージェントの失敗をプロセスとして解剖する大規模実証研究

投稿者: ユウ

TL;DR LLMコーディングエージェントの失敗を「最終結果」ではなく…

7月 13 2026

0

エージェントの圧縮処理を逆手に取る：CAPEによるコンテンツ保護手法

投稿者: ユウ

TL;DR LLMエージェントがWebコンテンツを圧縮する際に情報を破…

7月 12 2026

0

テスト時にエージェントの制御プログラムを進化させるTTHE：実行痕跡だけでハーネスを改善

投稿者: ユウ

TL;DR TTHEは、LLMエージェントの動作を決める「ハーネス」（…

7月 11 2026

0

WebSwarm：再帰的マルチエージェントで深く広いWeb検索を実現

投稿者: ユウ

TL;DR WebSwarmは、複雑なWeb検索タスクを再帰的にエージ…

7月 10 2026

0

自己利益追求エージェント社会で市場を安定させる仕組み：調停メカニズムの頑健性

投稿者: ユウ

TL;DR 自己利益のみを追求するLLMエージェント18体が3種の財を…

7月 10 2026

0

非同期RLでLLMエージェントを安定学習：シングルロールアウト最適化SAO

投稿者: ユウ

TL;DR SAOは、LLMエージェント向け非同期RLの安定性と効率を…

3月 04 2026

0

LLMエージェントの探索能力を強化する新手法RAPO：外部知識を活用した強化学習フレームワーク

投稿者: ユウ

TL;DR 既存のLLMエージェント向け強化学習（Agentic RL…

3月 04 2026

0

LLMエージェントの探索能力を高める「戦略誘導探索」：難易度の高いUI操作やコーディングタスクへの適用

投稿者: ユウ

TL;DR LLMエージェントの強化学習において、低レベルの行動探索で…

3月 02 2026

0

AIがRustの難問バグに挑む：大規模ベンチマークで実証された新手法「RustForger」の可能性

投稿者: ユウ

解説ねえ、智也くん！これ見て、『Evaluating and Imp…