Anthropic Code with Claude 2026 + 多Agent架构
Anthropic Code with Claude 2026:Claude Managed Agents 的 Workflow 能力
事件:2026年5月6日,Anthropic 在旧金山举办 Code with Claude 开发者大会
后续:5月19日伦敦场新增 Self-hosted Sandboxes + MCP Tunnels;6月10日东京场
核心理念:不再追求新模型,而是打磨生产级 Agent 基础设施
一、为什么要有这个功能?
Anthropic 的判断:模型智力不再是瓶颈,基础设施才是。 CEO Dario Amodei 在大会上说:
Q1 2026 年营收(年化)增长了 80 倍,而非预期中的 10 倍。这意味着算力压力极大(所以有了 SpaceX Colossus 合作)。但更重要的是——生产环境中 Agent 出问题的地方,99% 不是模型不行,而是编排、记忆、质量控制、安全这些基础设施不行。
大会的明确信号:不用再卷模型发布(这次一个模型都没发),全力搞定”怎么让 Agent 可靠地在生产环境跑起来”。
二、核心 Workflow 能力详解
1. 多 Agent 编排(Multiagent Orchestration)— 核心 Workflow 功能
状态:Public Beta
一个”领队 Agent”将复杂任务拆解,指派给最多 20 个 Specialist Agent 并行执行。
工作方式:
- 领队 Agent 规划任务分解
- 各 Specialist Agent 并行工作(各自有独立模型、提示词、工具集)
- 所有 Agent 共享文件系统,结果汇总回领队上下文
- 领队 Agent 可以中途检查进度
- 全过程在 Claude Console 可审计
示例场景: 一个主 Agent 负责事件调查,子 Agent 同时扫描部署历史、错误日志、监控指标、客服工单。
开发者使用场景:
- 大型重构(按模块/层拆分)
- 跨功能任务(后端 + 前端 + DevOps 同时推进)
- 并行研究(对比多种方案、分析依赖链)
定价注意: 20 个 Agent 并行意味着 20 倍的 token 消耗。
2. Dreaming(”梦境”)— 跨会话自我学习
状态:Research Preview
Agent 在会话之间自动运行,审查 transcripts,做三件事:
- 提取模式 — 发现重复出现的错误、工作流偏好
- 合并重复学习 — 去重,保留高价值信息
- 整理记忆存储 — 随时间推移保持高信号、低噪音
不修改原始数据。Harvey(法律 AI 平台)使用后任务完成率提升 6 倍。
3. Outcomes Loops(结果循环)— 自我质量门禁
状态:Public Beta
你写一份 Rubric,Agent 完成后由另一个独立的评分 Agent 打分:
- 分不够 → 打回重做
- 分够了 → 通知交付
评分 Agent 与执行 Agent 隔离,不会因看到推理过程而偏颇。
官方测试(不换模型,只加 Outcomes):
- Word 质量提升 8.4%
- PPT 提升 10.1%
- 结论:大量输出质量问题不是模型问题,是没人检查。
4. Webhooks — 外部集成
Agent 完成/出错/状态变化时,Slack、CI/CD、监控面板实时通知。无需轮询。
三、后续更新(5 月 19 日伦敦场)
Self-hosted Sandboxes(Public Beta)
Agent 代码执行移到客户自己的基础设施内(Cloudflare / Daytona / Modal / Vercel),敏感数据不离内网,企业安全团队放行。
MCP Tunnels(Research Preview)
内部 MCP 服务器无需公共端点,客户部署轻量网关,单向出站加密连接。
四、其他亮点
Boris Cherny(Claude Code 创造者): “Anthropic 内部已经没有一行手动编写的代码了。”
Dario Amodei: “2026 年会出现一个人撑起十亿美元公司的案例。”
SpaceX 算力合作: 月付 $12.5 亿给 Colossus 集群,到 2029 年总计$450 亿。速率限制翻倍。
五、Claude Code 多 Agent 架构关系(补充)
用户能不能自己创建?
可以。 三种方式:
- /agents 命令(推荐) — 终端运行 /agents → Library → Create new agent → Personal/Project → Generate with Claude → 自然语言描述 → 选工具/模型 → 保存即用
- 手写 Markdown 文件 — 存在
.claude/agents/(项目级)或~/.claude/agents/(用户级),优先级从高到低:Managed Settings > CLI –agents 参数 > 项目级 > 用户级 > 插件级 - 插件分发 — 打包在插件 agents/ 目录里
结构树
你
│
└── Claude Code 主会话
│
├── Subagents(内置 Task tool)— GA,稳定
│ ├─ Explore(Haiku,只读,搜代码)
│ ├─ Plan(继承模型,只读,规划)
│ ├─ General-purpose(继承模型,全权限)
│ └─ 你自定义的(code-reviewer / test-writer...)
│
│ 子 Agent 之间不通,只向主汇报,轻量
│
├── Agent Teams(实验性,需开启开关)
│ └─ 领队 Agent(Lead)
│ ├─ Teammate A — 独立会话,互相可通信
│ ├─ Teammate B — 共享任务列表
│ └─ Teammate C — 可自领取任务
│
│ 成员互相通信、共享任务列表、耗 token 多
│
└── Agent View(Research Preview)
claude agents 命令
你一屏管理后台会话,亲自协调派活
选哪个?
- 日常并行子任务 → Subagents(GA,最稳定)
- 需要 Agent 讨论协作 → Agent Teams(实验性)
- 管理多个独立任务 → Agent View
- 生产部署 → Managed Agents API