Anthropic Code with Claude 2026：Claude Managed Agents 的 Workflow 能力

事件：2026年5月6日，Anthropic 在旧金山举办 Code with Claude 开发者大会
后续：5月19日伦敦场新增 Self-hosted Sandboxes + MCP Tunnels；6月10日东京场
核心理念：不再追求新模型，而是打磨生产级 Agent 基础设施

一、为什么要有这个功能？

Anthropic 的判断：模型智力不再是瓶颈，基础设施才是。 CEO Dario Amodei 在大会上说：

Q1 2026 年营收（年化）增长了 80 倍，而非预期中的 10 倍。这意味着算力压力极大（所以有了 SpaceX Colossus 合作）。但更重要的是——生产环境中 Agent 出问题的地方，99% 不是模型不行，而是编排、记忆、质量控制、安全这些基础设施不行。

大会的明确信号：不用再卷模型发布（这次一个模型都没发），全力搞定”怎么让 Agent 可靠地在生产环境跑起来”。

二、核心 Workflow 能力详解

1. 多 Agent 编排（Multiagent Orchestration）— 核心 Workflow 功能

状态：Public Beta

一个”领队 Agent”将复杂任务拆解，指派给最多 20 个 Specialist Agent 并行执行。

工作方式：

领队 Agent 规划任务分解
各 Specialist Agent 并行工作（各自有独立模型、提示词、工具集）
所有 Agent 共享文件系统，结果汇总回领队上下文
领队 Agent 可以中途检查进度
全过程在 Claude Console 可审计

示例场景： 一个主 Agent 负责事件调查，子 Agent 同时扫描部署历史、错误日志、监控指标、客服工单。

开发者使用场景：

大型重构（按模块/层拆分）
跨功能任务（后端 + 前端 + DevOps 同时推进）
并行研究（对比多种方案、分析依赖链）

定价注意： 20 个 Agent 并行意味着 20 倍的 token 消耗。

2. Dreaming（”梦境”）— 跨会话自我学习

状态：Research Preview

Agent 在会话之间自动运行，审查 transcripts，做三件事：

提取模式 — 发现重复出现的错误、工作流偏好
合并重复学习 — 去重，保留高价值信息
整理记忆存储 — 随时间推移保持高信号、低噪音

不修改原始数据。Harvey（法律 AI 平台）使用后任务完成率提升 6 倍。

3. Outcomes Loops（结果循环）— 自我质量门禁

状态：Public Beta

你写一份 Rubric，Agent 完成后由另一个独立的评分 Agent 打分：

分不够 → 打回重做
分够了 → 通知交付

评分 Agent 与执行 Agent 隔离，不会因看到推理过程而偏颇。

官方测试（不换模型，只加 Outcomes）：

Word 质量提升 8.4%
PPT 提升 10.1%
结论：大量输出质量问题不是模型问题，是没人检查。

4. Webhooks — 外部集成

Agent 完成/出错/状态变化时，Slack、CI/CD、监控面板实时通知。无需轮询。

三、后续更新（5 月 19 日伦敦场）

Self-hosted Sandboxes（Public Beta）

Agent 代码执行移到客户自己的基础设施内（Cloudflare / Daytona / Modal / Vercel），敏感数据不离内网，企业安全团队放行。

MCP Tunnels（Research Preview）

内部 MCP 服务器无需公共端点，客户部署轻量网关，单向出站加密连接。

四、其他亮点

Boris Cherny（Claude Code 创造者）： “Anthropic 内部已经没有一行手动编写的代码了。”

Dario Amodei： “2026 年会出现一个人撑起十亿美元公司的案例。”

SpaceX 算力合作： 月付 $12.5 亿给 Colossus 集群，到 2029 年总计$450 亿。速率限制翻倍。

五、Claude Code 多 Agent 架构关系（补充）

用户能不能自己创建？

可以。 三种方式：

/agents 命令（推荐） — 终端运行 /agents → Library → Create new agent → Personal/Project → Generate with Claude → 自然语言描述 → 选工具/模型 → 保存即用
手写 Markdown 文件 — 存在 .claude/agents/（项目级）或 ~/.claude/agents/（用户级），优先级从高到低：Managed Settings > CLI –agents 参数 > 项目级 > 用户级 > 插件级
插件分发 — 打包在插件 agents/ 目录里

结构树

你
  │
  └── Claude Code 主会话
        │
        ├── Subagents（内置 Task tool）— GA，稳定
        │   ├─ Explore（Haiku，只读，搜代码）
        │   ├─ Plan（继承模型，只读，规划）
        │   ├─ General-purpose（继承模型，全权限）
        │   └─ 你自定义的（code-reviewer / test-writer...）
        │
        │   子 Agent 之间不通，只向主汇报，轻量
        │
        ├── Agent Teams（实验性，需开启开关）
        │   └─ 领队 Agent（Lead）
        │       ├─ Teammate A — 独立会话，互相可通信
        │       ├─ Teammate B — 共享任务列表
        │       └─ Teammate C — 可自领取任务
        │
        │   成员互相通信、共享任务列表、耗 token 多
        │
        └── Agent View（Research Preview）
            claude agents 命令
            你一屏管理后台会话，亲自协调派活

选哪个？

日常并行子任务 → Subagents（GA，最稳定）
需要 Agent 讨论协作 → Agent Teams（实验性）
管理多个独立任务 → Agent View
生产部署 → Managed Agents API

Anthropic Code with Claude 2026 + 多Agent架构