跳出个例：Agent的对抗式敏捷闭环

June 1, 2026 · Agent-Harness , Agile , Adversarial , Bdd , Long-Running-Agents

长时Agent常陷入低效循环——不断收集失败却无法沉淀出可复用的规则。本文在Anthropic的Planner–Generator–Evaluator架构和Ralph Loop基础上，引入敏捷开发的user story等作为最小可观测航点，通过对抗式评估和语义残差回传，把失败转化为下一轮的显式约束，提高Agent从失败中学习的效率。

OpenClaw：AI OS与Personal的早期实验？

March 17, 2026 · Openclaw , Personal-Agent , Agent-Memory , Ai-Os

OpenClaw把runtime、plugins、system calling和local-first memory放进同一个框架里，既回应了AI Agent工程化落地的需求，也开始触及个性化AI的方向。本文讨论它已经做对了什么、为什么这仍然只是早期实验，以及AI OS与personal memory未来可能如何分工。

OpenAI-o1

September 11, 2024 · Openai-O1 , Reasoning-Models , Chain-of-Thought , Mcts

从OpenAI o1与相关解读出发，这篇文章整理了对推理模型的理解，包括隐式CoT、类MCTS搜索、自举数据、Critic模型，以及推理能力与Agent能力之间的权衡。

Chenyang's Eureka

跳出个例：Agent的对抗式敏捷闭环

OpenClaw：AI OS与Personal的早期实验？

OpenAI-o1

More

Plan Search

TODO List

New COT Evaluation

Prompt Engineering for LLM Cot