跳出个例:Agent的对抗式敏捷闭环June 1, 2026 · Agent-Harness , Agile , Adversarial , Bdd , Long-Running-Agents长时Agent常陷入低效循环——不断收集失败却无法沉淀出可复用的规则。本文在Anthropic的Planner–Generator–Evaluator架构和Ralph Loop基础上,引入敏捷开发的user story等作为最小可观测航点,通过对抗式评估和语义残差回传,把失败转化为下一轮的显式约束,提高Agent从失败中学习的效率。read more
OpenClaw:AI OS与Personal的早期实验?March 17, 2026 · Openclaw , Personal-Agent , Agent-Memory , Ai-OsOpenClaw把runtime、plugins、system calling和local-first memory放进同一个框架里,既回应了AI Agent工程化落地的需求,也开始触及个性化AI的方向。本文讨论它已经做对了什么、为什么这仍然只是早期实验,以及AI OS与personal memory未来可能如何分工。read more
OpenAI-o1September 11, 2024 · Openai-O1 , Reasoning-Models , Chain-of-Thought , Mcts从OpenAI o1与相关解读出发,这篇文章整理了对推理模型的理解,包括隐式CoT、类MCTS搜索、自举数据、Critic模型,以及推理能力与Agent能力之间的权衡。read more