Self-Improving Agent 调研报告
Self-Improving Agent 调研报告
ClawHub 下载量第一的 Skill(425K 下载 / 3500 星)
基本信息
- 名称: Self-Improving Agent
- 作者: Peter Skoett(@pskoett)
- 下载量: 425,240(2026-05-16 数据,遥遥领先第二名 232K 近一倍)
- 星标: 3,500 ⭐
- 平台: OpenClaw(原生适配)、Claude Code、Codex、Copilot CLI
- 源码: https://github.com/pskoett/pskoett-ai-skills
- 安装方式:
clawhub install self-improving-agent
核心理念
这个 Skill 解决的是一个非常根本的问题:AI Agent 不会从错误中学习。
每次对话结束后,Agent 回到「出厂状态」。上次被纠正过的写法、踩过的坑、用户偏好的工作方式——全都不记得。下次同样的错误还会犯。
Self-Improving Agent 的核心思路是:用文件系统做持久记忆,让 Agent 在运行中自动记录教训,在后续会话中自动应用。
核心哲学可以用一句话概括——Agent 需要在正确的时间点利用其高峰上下文。作者认为 Agent 在「规划完成后」「执行中途」「完成时」「学到新东西时」这四个时刻上下文质量最高,这些时刻应该被结构化为可重复的工作流。
工作机制
三层日志系统
每次 Agent 遇到需要记录的事件,写到三个文件中:
| 文件 | 用途 | 触发条件 |
|---|---|---|
| .learnings/LEARNINGS.md | 教训、纠正、最佳实践 | 用户指出错误/找到更好方案/知识过时 |
| .learnings/ERRORS.md | 命令失败、外部服务异常 | 命令执行出错/API 调用失败 |
| .learnings/FEATURE_REQUESTS.md | 用户想要但 Agent 没有的能力 | 用户提出功能需求 |
每条记录有标准格式:ID(如 LRN-20260517-001)、优先级、状态、所属领域、详细描述、建议修复方案。
晋升机制
这是它的精髓——不是记了就完事,而是:
- 日志收集 — Agent 日常记录错误和教训到 .learnings/
- 判断是否普适 — 如果某条教训只适用于当前场景,留着就行
- 晋升到持久文件 — 如果适用于所有场景,写到 SOUL.md、AGENTS.md、TOOLS.md 或 CLAUDE.md
双循环学习
这是作者在 GitHub 上讲的进阶用法:
- 内循环(同一会话内): Agent 检测到问题 → 自动验证 → 自行修复,不需要人介入
- 外循环(跨会话): 记录错误 → 提炼模式 → 编码为规则 → 建立回归测试 → 下个会话自动检查
外循环配有专门的配套工具:learning-aggregator(聚合跨会话的学习记录)、harness-updater(把模式写成永久规则)、eval-creator(把规则变成回归测试)、pre-flight-check(新会话启动时做全面检查)。这个过程不断循环,知识盲区越来越少。
为什么这么火?
1. 切中所有人的痛点
Agent 「不长记性」是每个深度用户都遇到的问题。这个 Skill 用一个极其轻量的方式解决了——不需要数据库、不需要 AI 服务、不需要复杂配置,就是三个 Markdown 文件。
2. 多平台支持
它不仅适配 OpenClaw,还支持 Claude Code、Codex、Copilot CLI、GitHub CLI。只要能读写文件就能跑。
3. 零外部依赖
不依赖任何第三方 API、不需要数据库、不需要额外服务。纯文件系统操作,零成本、零风险。
4. 可扩展的设计
从简单的「记录错误」到复杂的「跨会话知识聚合+回归测试」都有路径。新手用基础功能、老手开进阶模式。
5. 作者的信誉
Peter Skoett 发布了一整套 Skill 套件(plan-interview、verify-gate、simplify-and-harden、context-surfing 等),每个解决一个 Agent 的核心失效模式。Self-Improving 只是其中最受欢迎的一个。
对比同类 Skill
榜单第三名 Self-Improving + Proactive Agent(@ivangdavila,181K 下载)思路类似,但侧重点不同:
| 维度 | Self-Improving Agent(第一名) | Self-Improving + Proactive(第三名) |
|---|---|---|
| 核心思路 | 记录错误 + 晋升到永久文件 | 自我反思 + 主动建议 |
| 记忆载体 | 三个 Markdown 文件 | 自己的一套内存管理 |
| 外挂 | 配套(harness-updater, learning-aggregator) | WAL Protocol + Autonomous Crons |
| 风格 | 极简、务实、零依赖 | 功能丰富、主动推送 |
| 下载量 | 425K | 181K |
第一名胜在「简单到极致」——你不需要看文档就知道怎么用。
对 OpenClaw 用户的建议
如果你已经用着 OpenClaw,这个 Skill 几乎没有理由不装:
clawhub install self-improving-agent
装完之后不用做任何额外配置,日常使用中 Agent 犯错时会自动记录。运行一段时间后你会发现同一个错误不再犯第二次——这才是 Agent 该有的样子。
潜在不足
- 纯文本记录 — 没有搜索功能,日志多了以后只能靠手动翻
- 没有去重机制 — 同一条错误可能被重复记录
- 晋升需要人工判断 — Agent 自动晋升可能把一次性的教训写到 AGENTS.md 里
- 多人项目可能冲突 — 每个开发者各自维护自己的 .learnings/
总体来说瑕不掩瑜,425K 的下载量已经说明了一切。