Anthropic 的 PM,是怎么工作的
sharing
Jess Yan 是 Anthropic 的一位 PM。她刚刚做了一个分享,颇为有趣:在 AI 时代当 PM,我的工作反而更像人了
PM 这个岗位,过去大半时间花在协调上:跨部门会议、汇报、工程团队的工单 backlog,做完决定还得上山下乡说服人、拉资源。真正的手艺(craft)反而是被挤掉的那一块。借助 Claude,她现在能把协调那部分压缩,把时间还给手艺本身

Cat Wu 在 3 月那篇 PM on the AI exponential 里画的工作流分工图
Jess 在 Anthropic 内部负责的产品叫 Claude Managed Agents,说人话就是一套让开发者方便地把 AI 当员工调用的云服务。你给一个目标,云上就会有一个或一组 AI agent 替你跑活,sandbox、权限、tracing 这些底层活儿都托管,跑完把结果还给你。这套东西 4 月 8 日刚开公开 beta
文档先死了
在她以往的工作中,API 设计是在 Google Doc 里。一个人写一份 spec,开评审会,邮件里塞批注,多周以后回头看,文档读着挺漂亮,真的拿去构建一遇到具体问题就崩
Jess 给的方法是不写 spec 写原型。她在 Claude Code 里直接拿 pre-production 的 API spec 跑一个 agent,一个下午就能从 hello world 跑到端到端原型。
这个动作让她在产品发布前就把 API abstraction 和 Claude Console 的 UX 改了几轮。她说这些改动哪怕做几周文档评审都暴露不出来,等发出去再从用户反馈里捡回来又太晚
她还会跑 raw curl 请求确认 bare-metal 体验是否舒服。shipping 的检验标准换了一种,文档读着对只是修辞,能不能跑才算数
Claude 三件套分工
Jess 的稳定工作流分布在三个产品上:
Claude开放式的研究和探索。早期模糊阶段、需要持续对话的时候,她在这里
Claude Cowork其他一切知识工作。发邮件、收件箱归零、代办清单、做 slides、翻 Slack 历史、订商务出行
Claude Code一旦想清楚要解决什么问题,就来这里写一个定制 agent,底层跑在 Managed Agents 上

METR 测的「人类等价时长」从 Sonnet 3.5 (new) 的 21 分钟跳到 Opus 4.6 的 12 小时,16 个月 41x
她对这件事的描述压成一句话:能拿自己的产品做实验,这件事抬升了你能想象出来的下个版本的天花板。原来 PM 只能想象自己能想象的,现在 PM 能想象自己能造出来的。这两件事不一样
PM 自己开三个 Agent
在工作中,她使用着三个具体 agent:
数据分析 agent(Adoption analytics)
接进内部数据库,配了理解数据 schema 的 skill,自己跑 query 找异常和模式。带 memory,跑过的发现会沉淀,下一轮在上一轮的基础上推进
开发者舆情监控 agent(Developer sentiment monitoring)
带内置 web search,按一个域名清单扫开发者反馈,归纳共同主题。内容多到一个 agent 处理不过来时,fan-out 到多个 agent 并行,等结果,再综合
Demo 构建 agent(Demo building)
接进 demo 用的 GitHub 仓库、品牌素材、活动 deck,把模板转成针对具体场合的 demo(会议一版、客户会议一版)

Claude Managed Agents 架构图
以及,这三个 agent 都在云上跑。Jess 可以走开做别的事,回来发现已经做完发布了
Managed Agents 是什么
Managed Agents 公开 beta 配齐四个核心能力:
生产级 agentsandbox、鉴权、工具执行替你处理
长会话自主跑几个小时,掉线也保留进度和输出
多 agent 协作agent 可以拉起其他 agent 并行(research preview)
可信治理scoped 权限、身份管理、tracing 都是默认配的
Jess 在特别提了一个东西: memory
Memory 4 月 23 日刚开 beta,给 Managed Agents 的 agent 加了跨 session 学习能力。底层是文件系统型 memory,agent 直接用 bash 和 code execution 读写,开发者也可以 export 出来独立管理,所有改动都有 audit log

Memory 公告里的题图
调用 Managed Agents 简单到一句话。Jess 在 Claude Code 里加载 Managed Agents skill,给 agent 一个粗略草图就开工。开发者也可以直接对最新版 Claude Code 说 start onboarding for managed agents in Claude API,剩下的 onboarding 路径它自己走
Rakuten 错误降 97%
Rakuten 在 Memory 公告里贡献了三个数字:
first-pass 错误 -97% 成本 -27% 延迟 -34%
意思是 agent 学会了避坑,而且坑是在 workspace 边界里学的,可观测。Wisedocs 的文档校验流水线接 Memory 后整体效率提升 30%。Netflix 用 agent 跨会话保留上下文,包括需要多轮才能挖出来的洞察、人类中途纠正过的修改
客户案例侧已经铺得很广。Notion 让团队在 workspace 里把活直接分给 Claude,工程师用它写代码、知识工作者用它做 slides 和 spreadsheets,几十个任务并行跑;Vibecode 把 Managed Agents 当默认底座,用户从一句 prompt 到部署完快了 10 倍以上;Sentry 把它的 debugging agent Seer 接到一个 Claude agent,从 bug 定位直接到一个可 review 的 PR 一气呵成;Asana、Atlassian、Blockit、General Legal 都是公开列名的客户
定价是消费量计费,标准 Claude Platform token 单价之外,加 $0.08 / session-hour 的 active runtime
先开一个再说
你一直想要的实验和工具,现在距离你只有一句 prompt 加几个 API call
其实,大多数 PM 还在「做 PRD-等排期-等 review」的三段论里。而当 PM 自己能调用 agent 交付任务后,生产节奏也会随之变化
从此,PM 的评价标准里会多出一项:你的多少工作,是 agent 产出的?
参考材料
→
Product development in the agentic era claude.com/blog/product-development-in-the-agentic-era
→
Claude Managed Agents claude.com/blog/claude-managed-agents
→
Built-in memory for Claude Managed Agents claude.com/blog/claude-managed-agents-memory
→
Product management on the AI exponential claude.com/blog/product-management-on-the-ai-exponential
