从腾讯文档升级看腾讯在Agent赛道上的节奏
2025 年,姚顺雨写过一篇传播很广的文章,叫《The Second Half》。
核心观点就一句话——
AI 的上半场,模型在拼在各种有明确标准的 Benchmark,但下半场,该拼在标准没有辣么确定的真实世界如何干活。
一年后,这位《AI 下半场》的作者,成了腾讯的首席 AI 科学家。
最近腾讯文档的升级,其实就是在回答那个下半场的问题:AI如何更高效地干活?
正好最近在Twitter刷到一条推文——

没错,今天的话题聊的就是腾讯文档和WorkBuddy的化学反应。
一
废话少说,先看东西——
我打开升级后和WorkBuddy合体后的腾讯文档,给它布置了一个任务:
帮我写一份Claude Code和Codex的发展对比分析报告。
注意:我说的不是打开一个对话框跟AI聊天,让它一坨一坨地往外吐文字,然后复制粘贴到文档里,那是很久以前的玩法。
我说的是,在同一个文档编辑器里,先写了一个大纲框架,列了几个我关心的维度:产品定位、用户规模以及商业模式等。
然后WorkBuddy直接在我的腾讯文档里动手了——
写完之后,我可以即见即所得地选中一段下达指令,无论是格式还是内容,都可以快速修改。

两个人,好吧,一个人一个AI,在同一份文档里同时写,互相能看见对方在干嘛,写到某个节点觉得写得不对,直接改。
这个体验,怎么说呢,的确有点东西。
过去所有的AI办公产品,交互模式基本上都一个样:我问,AI答,我不满意,AI重新生成。
很显然,腾讯文档的这次做了创新,他们管这个叫:人机双写。
二
要更深入理解腾讯文档这次升级,我们先先看看AI办公这条赛道过去两年到底在卷什么。
2023年3月,微软推出Microsoft 365 Copilot。
三年过去了,结果怎么样呢?
截至2026年1月,Copilot付费用户1500万。
听着不少对吧?
但Office 365的总用户数是4.5亿,付费转化率:3%。
3%。
微软自己都急了。
2026年4月,CEO纳德拉亲自下场重组Copilot工程团队,提拔高管组建12人精锐小队。
计划把OpenClaw那套Agent能力塞进Copilot里,试图在6月的Build大会上放大招。
再看Google,Gemini的确接入Google Workspace,但你说Workspace因此体验或存在感提升了吗?
好像也木有。
在我看来,原因在于——所有人都在做AI办公,但大多数产品的交互范式都停留在同一个阶段:对话式。
用户提需求,AI生成内容,用户决定要不要。
这个模式在我看来有一个缺陷:AI是一个外挂,木有真正地融进产品。
三
我一直觉得,AI办公产品的演进,可以分成三个阶段——
第一阶段是工具期。
AI帮你润色一段文字、生成一页PPT,本质上是一个高级版的自动补全,市面上绝大多数产品都处在这个阶段。
第二阶段是助手期。
AI能理解你的意图,能根据上下文做更复杂的任务。比如把表格里的数据做成图表,它能选合适的图表类型,Copilot最近能做到这一步。
第三阶段是协作期。
AI进入你的工作环境,和你在同一个空间里一起干活,能看到你在做什么,做到实时响应。
腾讯文档这次做的人机双写,就属于这个阶段。

那么它是如何做到这一点的呢?
答案是:它靠的是一整套能力的聚合。
文档编辑器是前台,WorkBuddy是Agent引擎,混元大模型是底层算力,腾讯网盘是记忆底座。
"WorkBuddy 是 Agent 引擎"这句话,其实还能再往下挖一层。
这就要说到这次升级很硬核的部分——技术底座。
业界雀食有很多产品是套壳滴,但腾讯文档这次走得更深:它原生采用了 WorkBuddy 的统一Agent内核。
但光有统一的Agent能力内核还不够,腾讯文档在内核之上,又叠了两样自己的东西——
一样是自研的高性能编辑引擎,这是让Agent 实现精准编辑文档、PPT、表格的关键。
另一样是丰富的品类专业Skill,这些Skills专门针对文档类的特定任务进行了定向优化。
统一内核叠加自研引擎,再加上品类 Skill,融合后的新版文档Agent,在任务拆解、工具调用、上下文记忆这几个核心能力上,都有明显提升。
这也是人机双写操作起来非常自然且顺手的重要原因。
四
人机双写是这次升级里的重点,另外两个同样值得说——
第二个升级,是文档企业版全面 AI 化。
文档、表格、PPT 各个品类全面接入 AI 助手,企业版同步接进 WorkBuddy。
这一步的意义在于:一个能力先在 C 端几亿用户那里跑顺,再原封不动地延伸到企业场景里去。
这条从个人到企业的路,腾讯文档走得比较稳。
毕竟,它本来就是国民级产品。
第三个升级,是端内 Agent 升级。
文档端内的 Agent 调用 WorkBuddy 的框架能力并做了深度优化,文档、表格、PPT 支持了自然语言操作,一句话就能生成并操作整份方案、整张表格、整套 PPT。
腾讯文档的这次升级,生态开放也是重点——
具体而言,开放了两个通道:Skill(基于MCP协议)和OpenAPI。
接入MCP协议意味在任何支持MCP的智能体产品里,用自然语言就能调用腾讯文档的全部能力。
不需要打开腾讯文档的网页或者App,直接在日常使用的AI工具中下达需求,腾讯文档执行后,结果直接返回到工作流里。
OpenAPI更加开放:面向企业和个人开发者,不需要企业资质就能接入腾讯文档的全部能力。
这在国内同类产品中算是比较激进的策略了。
大多数厂商的API开放都要求企业认证、审核流程一堆事情,个人开发者基本被挡在门外。
一个值得注意的细节是:ima也已经宣布接入WorkBuddy。
也就是说,腾讯正在把WorkBuddy的Agent能力向自己生态内的更多产品辐射。
当Agent能力渗透到腾讯整个C端和B端产品矩阵中,这个串起来的能量还是很大的。
腾讯为什么要把文档能力开放得这么彻底?
在我看来,原因在于:在Agent时代,文档的角色变了。
以前的文档你写完了,存起来,发给别人看。
现在的文档变成了AI工作流中被反复调用的组件。
AI Agent在执行任务的过程中,随时需要创建文档、修改文档以及基于文档内容做决策。
这个角色转变,直接改变了文档产品的定位。
谁的文档能力被更多的Agent调用,谁就成了AI办公生态的基础设施。
五
我再展开说一个实操场景,进一步说明这套体系到底能干什么。
假设你是一个运营负责人,手上有一份上个月的用户增长数据表格,存在腾讯网盘里。
你需要做三件事——
第一,基于数据做一份增长分析报告。第二,从报告中提炼关键结论做成一套汇报PPT。第三,把PPT分享给团队。
现在用腾讯文档加WorkBuddy操作起来就很简单了:
第一步,在WorkBuddy里说一句话:把网盘里上个月的用户增长数据拉出来,做一份增长分析报告。
WorkBuddy直接从腾讯网盘调取文件,它知道你的文件在哪、什么内容,然后在腾讯文档里创建一份新文档,开始写报告。
第二步,报告初稿出来之后,你在文档里直接改。觉得某个结论的论据不够充分?自己补一段或者重写,你和AI在同一份文档里协作。
第三步,报告定稿后,你再说一句:基于这份报告生成一套汇报PPT,突出三个核心数据结论,直接产出一份完整的PPT。
然后就可以一键分享给团队,全程在一个环境里完成,不需要在多个工具之间跳来跳去。
我还试了一个场景——
让WorkBuddy在腾讯文档里创建一份表格,把我过去三个月发布的文章按阅读量、转发量、评论数做了一个汇总。
然后基于这些数据识别出哪类选题表现最好,哪个发布时间段的数据最高,最后输出一份选题优化建议。
它大概用了五六分钟——当然,中间有两个数据它漏掉了,我在文档里直接改了,但整体的分析逻辑、结论提炼都没毛病。
从这个意义上,升级后的腾讯有点像一个有判断力的同事,你给方向,它干活。
它把80%的脏活累活先扛了,你只需要聚焦在最重要的那20%上。
这也是腾讯文档和一些散装AI办公产品最大的区别。
关于这一点,用的时间越长,感受越明显。
六
还有一个逻辑也必须说一说——
6月这次腾讯云的AI产业应用大会上,腾讯做了一件之前没做过的事:首次发布效率智能体工具集。
什么意思呢?
就是腾讯把分散在各个产品线里的AI能力,沉淀成了一套可协同的完整工具。
模型服务、Agent应用、开发工具、效率智能体应用,全部打包,面向个人、办公、企业三大场景,覆盖办公协同、代码研发、知识管理、设计创作、营销客服、数据分析等高频场景。
这个工具集的核心框架是这样的,具体分三层——
底层是混元模型持续迭代提供算力支撑。
中间层是WorkBuddy加CodeBuddy的Agent框架。
应用层是腾讯文档、腾讯会议、企业微信、腾讯网盘等一系列产品。
腾讯庞大的 C 端和 B 端生态,让它天然具备场景红利,而场景和连接,决定一个Agent能进化到多高。
这一点,是腾讯的家底,别人羡慕不来。
七
最后说说我自己的感受。
我用腾讯文档加WorkBuddy一阵时间,除了开头说的那份Claude Code和Codex对比报告,我还试过让它帮我做行业数据整理、选题分析、AI论文抓取等。
整体体验下来就两个字:靠谱。
我喜欢用它,其中一个原因是它比较省心,交互上比较自然,成本也可控,不需要怎么折腾。
我想,经常整文档、PPT和Excel的白领,腾讯文档加WorkBuddy就是实用之选。
当然,也不是什么都好,有时候它的格式审美让人一言难尽,同时它对某些专业领域的理解深度和Claude和GPT的模型相比还有差距。
但方向对了。
AI办公的竞争已经走到了一个关键拐点。
很多单点的能力,大家都能做,接下来比的是:你的AI能在真实工作流里端到端把活干完并且完成交付吗?
从散装AI到套件级融合——这条路腾讯文档开了一个不错的头。
如果我们从更高一些的视角来看腾讯,会发现混元基座补齐、效率工具集成、Agent深度接入。
这些放在一起看,腾讯在AI办公这个战场上,确实在找到自己的节奏。
下一步就看混元的下一个大版本能不能在模型能力上再上一个台阶,以及人机双写这个品类能不能在用户端得到大规模验证了。
的确,为什么真正靠谱好用的AI Agent产品并不多?
原因其实很简单:Agent需要的技术栈要求太全面,缺一环,基本上就只能做个聊天机器人换皮。
腾讯这次的策略,就是是多层推进——
混元Hy3做基座,WorkBuddy做框架,腾讯文档做场景,网盘做数据底座,MCP加OpenAPI做开放通道。
有人可能会说,这不就是因为腾讯家大业大嘛,什么都有,拼起来就行了。
我倒是不这么看。
原因在于拼好也是有难度的:这些东西分属不同的产品线、不同的团队、不同的技术栈。
要让它们真正打通,需要顶层设计和执行力。
对于腾讯这样大厂而言,确实是不容易滴。
从这次腾讯文档的升级来看,至少在效率办公这个方向上,腾讯的劲在往一块使。
结语
我个人对厂商造词一向警惕,人机双写这个词能不能在行业里立住,还得看用户用脚投票。
但我愿意给它一个不错的评价,原因在于:对于没有极其复杂需求的日常办公一族,这是一个非常实用的工具。
腾讯这次给我的感觉,是终于在 Agent 这个战场上,找回了自己的手感。
它就守着自己的家底,把AI一点一点地原生融进去。
慢半拍没关系,关键是这一拍,踩在了点上。
——End——
作者简介:卫夕,公众号“卫夕指北”出品人,科技专栏作者,专写长文,专写不一样的,专注剖析AI、广告及互联网的底层逻辑;不关注这个账号,你都不知道你会错过神马!

