知识
← 返回

Self-Improving Agent 调研报告

2026-05-17 金融
#金融 #githubfetch

Self-Improving Agent 调研报告

ClawHub 下载量第一的 Skill(425K 下载 / 3500 星)

基本信息

  • 名称: Self-Improving Agent
  • 作者: Peter Skoett(@pskoett)
  • 下载量: 425,240(2026-05-16 数据,遥遥领先第二名 232K 近一倍)
  • 星标: 3,500 ⭐
  • 平台: OpenClaw(原生适配)、Claude Code、Codex、Copilot CLI
  • 源码: https://github.com/pskoett/pskoett-ai-skills
  • 安装方式: clawhub install self-improving-agent

核心理念

这个 Skill 解决的是一个非常根本的问题:AI Agent 不会从错误中学习

每次对话结束后,Agent 回到「出厂状态」。上次被纠正过的写法、踩过的坑、用户偏好的工作方式——全都不记得。下次同样的错误还会犯。

Self-Improving Agent 的核心思路是:用文件系统做持久记忆,让 Agent 在运行中自动记录教训,在后续会话中自动应用。

核心哲学可以用一句话概括——Agent 需要在正确的时间点利用其高峰上下文。作者认为 Agent 在「规划完成后」「执行中途」「完成时」「学到新东西时」这四个时刻上下文质量最高,这些时刻应该被结构化为可重复的工作流。

工作机制

三层日志系统

每次 Agent 遇到需要记录的事件,写到三个文件中:

文件 用途 触发条件
.learnings/LEARNINGS.md 教训、纠正、最佳实践 用户指出错误/找到更好方案/知识过时
.learnings/ERRORS.md 命令失败、外部服务异常 命令执行出错/API 调用失败
.learnings/FEATURE_REQUESTS.md 用户想要但 Agent 没有的能力 用户提出功能需求

每条记录有标准格式:ID(如 LRN-20260517-001)、优先级、状态、所属领域、详细描述、建议修复方案。

晋升机制

这是它的精髓——不是记了就完事,而是:

  1. 日志收集 — Agent 日常记录错误和教训到 .learnings/
  2. 判断是否普适 — 如果某条教训只适用于当前场景,留着就行
  3. 晋升到持久文件 — 如果适用于所有场景,写到 SOUL.md、AGENTS.md、TOOLS.md 或 CLAUDE.md

双循环学习

这是作者在 GitHub 上讲的进阶用法:

  • 内循环(同一会话内): Agent 检测到问题 → 自动验证 → 自行修复,不需要人介入
  • 外循环(跨会话): 记录错误 → 提炼模式 → 编码为规则 → 建立回归测试 → 下个会话自动检查

外循环配有专门的配套工具:learning-aggregator(聚合跨会话的学习记录)、harness-updater(把模式写成永久规则)、eval-creator(把规则变成回归测试)、pre-flight-check(新会话启动时做全面检查)。这个过程不断循环,知识盲区越来越少。

为什么这么火?

1. 切中所有人的痛点

Agent 「不长记性」是每个深度用户都遇到的问题。这个 Skill 用一个极其轻量的方式解决了——不需要数据库、不需要 AI 服务、不需要复杂配置,就是三个 Markdown 文件。

2. 多平台支持

它不仅适配 OpenClaw,还支持 Claude Code、Codex、Copilot CLI、GitHub CLI。只要能读写文件就能跑。

3. 零外部依赖

不依赖任何第三方 API、不需要数据库、不需要额外服务。纯文件系统操作,零成本、零风险。

4. 可扩展的设计

从简单的「记录错误」到复杂的「跨会话知识聚合+回归测试」都有路径。新手用基础功能、老手开进阶模式。

5. 作者的信誉

Peter Skoett 发布了一整套 Skill 套件(plan-interview、verify-gate、simplify-and-harden、context-surfing 等),每个解决一个 Agent 的核心失效模式。Self-Improving 只是其中最受欢迎的一个。

对比同类 Skill

榜单第三名 Self-Improving + Proactive Agent(@ivangdavila,181K 下载)思路类似,但侧重点不同:

维度 Self-Improving Agent(第一名) Self-Improving + Proactive(第三名)
核心思路 记录错误 + 晋升到永久文件 自我反思 + 主动建议
记忆载体 三个 Markdown 文件 自己的一套内存管理
外挂 配套(harness-updater, learning-aggregator) WAL Protocol + Autonomous Crons
风格 极简、务实、零依赖 功能丰富、主动推送
下载量 425K 181K

第一名胜在「简单到极致」——你不需要看文档就知道怎么用。

对 OpenClaw 用户的建议

如果你已经用着 OpenClaw,这个 Skill 几乎没有理由不装

clawhub install self-improving-agent

装完之后不用做任何额外配置,日常使用中 Agent 犯错时会自动记录。运行一段时间后你会发现同一个错误不再犯第二次——这才是 Agent 该有的样子。

潜在不足

  1. 纯文本记录 — 没有搜索功能,日志多了以后只能靠手动翻
  2. 没有去重机制 — 同一条错误可能被重复记录
  3. 晋升需要人工判断 — Agent 自动晋升可能把一次性的教训写到 AGENTS.md 里
  4. 多人项目可能冲突 — 每个开发者各自维护自己的 .learnings/

总体来说瑕不掩瑜,425K 的下载量已经说明了一切。