从腾讯文档升级看腾讯在Agent赛道上的节奏

发布时间：2026-06-05来源：卫夕指北

2025 年，姚顺雨写过一篇传播很广的文章，叫《The Second Half》。

核心观点就一句话——

AI 的上半场，模型在拼在各种有明确标准的 Benchmark，但下半场，该拼在标准没有辣么确定的真实世界如何干活。

一年后，这位《AI 下半场》的作者，成了腾讯的首席 AI 科学家。

最近腾讯文档的升级，其实就是在回答那个下半场的问题：AI如何更高效地干活？

正好最近在Twitter刷到一条推文——

没错，今天的话题聊的就是腾讯文档和WorkBuddy的化学反应。

一

废话少说，先看东西——

我打开升级后和WorkBuddy合体后的腾讯文档，给它布置了一个任务：

帮我写一份Claude Code和Codex的发展对比分析报告。

注意：我说的不是打开一个对话框跟AI聊天，让它一坨一坨地往外吐文字，然后复制粘贴到文档里，那是很久以前的玩法。

我说的是，在同一个文档编辑器里，先写了一个大纲框架，列了几个我关心的维度：产品定位、用户规模以及商业模式等。

然后WorkBuddy直接在我的腾讯文档里动手了——

写完之后，我可以即见即所得地选中一段下达指令，无论是格式还是内容，都可以快速修改。

两个人，好吧，一个人一个AI，在同一份文档里同时写，互相能看见对方在干嘛，写到某个节点觉得写得不对，直接改。

这个体验，怎么说呢，的确有点东西。

过去所有的AI办公产品，交互模式基本上都一个样：我问，AI答，我不满意，AI重新生成。

很显然，腾讯文档的这次做了创新，他们管这个叫：人机双写。

二

要更深入理解腾讯文档这次升级，我们先先看看AI办公这条赛道过去两年到底在卷什么。

2023年3月，微软推出Microsoft 365 Copilot。

三年过去了，结果怎么样呢？

截至2026年1月，Copilot付费用户1500万。

听着不少对吧？

但Office 365的总用户数是4.5亿，付费转化率：3%。

3%。

微软自己都急了。

2026年4月，CEO纳德拉亲自下场重组Copilot工程团队，提拔高管组建12人精锐小队。

计划把OpenClaw那套Agent能力塞进Copilot里，试图在6月的Build大会上放大招。

再看Google，Gemini的确接入Google Workspace，但你说Workspace因此体验或存在感提升了吗？

好像也木有。

在我看来，原因在于——所有人都在做AI办公，但大多数产品的交互范式都停留在同一个阶段：对话式。

用户提需求，AI生成内容，用户决定要不要。

这个模式在我看来有一个缺陷：AI是一个外挂，木有真正地融进产品。

三

我一直觉得，AI办公产品的演进，可以分成三个阶段——

第一阶段是工具期。

AI帮你润色一段文字、生成一页PPT，本质上是一个高级版的自动补全，市面上绝大多数产品都处在这个阶段。

第二阶段是助手期。

AI能理解你的意图，能根据上下文做更复杂的任务。比如把表格里的数据做成图表，它能选合适的图表类型，Copilot最近能做到这一步。

第三阶段是协作期。

AI进入你的工作环境，和你在同一个空间里一起干活，能看到你在做什么，做到实时响应。

腾讯文档这次做的人机双写，就属于这个阶段。

那么它是如何做到这一点的呢？

答案是：它靠的是一整套能力的聚合。

文档编辑器是前台，WorkBuddy是Agent引擎，混元大模型是底层算力，腾讯网盘是记忆底座。

"WorkBuddy 是 Agent 引擎"这句话，其实还能再往下挖一层。

这就要说到这次升级很硬核的部分——技术底座。

业界雀食有很多产品是套壳滴，但腾讯文档这次走得更深：它原生采用了 WorkBuddy 的统一Agent内核。

但光有统一的Agent能力内核还不够，腾讯文档在内核之上，又叠了两样自己的东西——

一样是自研的高性能编辑引擎，这是让Agent 实现精准编辑文档、PPT、表格的关键。

另一样是丰富的品类专业Skill，这些Skills专门针对文档类的特定任务进行了定向优化。

统一内核叠加自研引擎，再加上品类 Skill，融合后的新版文档Agent，在任务拆解、工具调用、上下文记忆这几个核心能力上，都有明显提升。

这也是人机双写操作起来非常自然且顺手的重要原因。

四

人机双写是这次升级里的重点，另外两个同样值得说——

第二个升级，是文档企业版全面 AI 化。

文档、表格、PPT 各个品类全面接入 AI 助手，企业版同步接进 WorkBuddy。

这一步的意义在于：一个能力先在 C 端几亿用户那里跑顺，再原封不动地延伸到企业场景里去。

这条从个人到企业的路，腾讯文档走得比较稳。

毕竟，它本来就是国民级产品。

第三个升级，是端内 Agent 升级。

文档端内的 Agent 调用 WorkBuddy 的框架能力并做了深度优化，文档、表格、PPT 支持了自然语言操作，一句话就能生成并操作整份方案、整张表格、整套 PPT。

腾讯文档的这次升级，生态开放也是重点——

具体而言，开放了两个通道：Skill（基于MCP协议）和OpenAPI。

接入MCP协议意味在任何支持MCP的智能体产品里，用自然语言就能调用腾讯文档的全部能力。

不需要打开腾讯文档的网页或者App，直接在日常使用的AI工具中下达需求，腾讯文档执行后，结果直接返回到工作流里。

OpenAPI更加开放：面向企业和个人开发者，不需要企业资质就能接入腾讯文档的全部能力。

这在国内同类产品中算是比较激进的策略了。

大多数厂商的API开放都要求企业认证、审核流程一堆事情，个人开发者基本被挡在门外。

一个值得注意的细节是：ima也已经宣布接入WorkBuddy。

也就是说，腾讯正在把WorkBuddy的Agent能力向自己生态内的更多产品辐射。

当Agent能力渗透到腾讯整个C端和B端产品矩阵中，这个串起来的能量还是很大的。

腾讯为什么要把文档能力开放得这么彻底？

在我看来，原因在于：在Agent时代，文档的角色变了。

以前的文档你写完了，存起来，发给别人看。

现在的文档变成了AI工作流中被反复调用的组件。

AI Agent在执行任务的过程中，随时需要创建文档、修改文档以及基于文档内容做决策。

这个角色转变，直接改变了文档产品的定位。

谁的文档能力被更多的Agent调用，谁就成了AI办公生态的基础设施。

五

我再展开说一个实操场景，进一步说明这套体系到底能干什么。

假设你是一个运营负责人，手上有一份上个月的用户增长数据表格，存在腾讯网盘里。

你需要做三件事——

第一，基于数据做一份增长分析报告。第二，从报告中提炼关键结论做成一套汇报PPT。第三，把PPT分享给团队。

现在用腾讯文档加WorkBuddy操作起来就很简单了：

第一步，在WorkBuddy里说一句话：把网盘里上个月的用户增长数据拉出来，做一份增长分析报告。

WorkBuddy直接从腾讯网盘调取文件，它知道你的文件在哪、什么内容，然后在腾讯文档里创建一份新文档，开始写报告。

第二步，报告初稿出来之后，你在文档里直接改。觉得某个结论的论据不够充分？自己补一段或者重写，你和AI在同一份文档里协作。

第三步，报告定稿后，你再说一句：基于这份报告生成一套汇报PPT，突出三个核心数据结论，直接产出一份完整的PPT。

然后就可以一键分享给团队，全程在一个环境里完成，不需要在多个工具之间跳来跳去。

我还试了一个场景——

让WorkBuddy在腾讯文档里创建一份表格，把我过去三个月发布的文章按阅读量、转发量、评论数做了一个汇总。

然后基于这些数据识别出哪类选题表现最好，哪个发布时间段的数据最高，最后输出一份选题优化建议。

它大概用了五六分钟——当然，中间有两个数据它漏掉了，我在文档里直接改了，但整体的分析逻辑、结论提炼都没毛病。

从这个意义上，升级后的腾讯有点像一个有判断力的同事，你给方向，它干活。

它把80%的脏活累活先扛了，你只需要聚焦在最重要的那20%上。

这也是腾讯文档和一些散装AI办公产品最大的区别。

关于这一点，用的时间越长，感受越明显。

六

还有一个逻辑也必须说一说——

6月这次腾讯云的AI产业应用大会上，腾讯做了一件之前没做过的事：首次发布效率智能体工具集。

什么意思呢？

就是腾讯把分散在各个产品线里的AI能力，沉淀成了一套可协同的完整工具。

模型服务、Agent应用、开发工具、效率智能体应用，全部打包，面向个人、办公、企业三大场景，覆盖办公协同、代码研发、知识管理、设计创作、营销客服、数据分析等高频场景。

这个工具集的核心框架是这样的，具体分三层——

底层是混元模型持续迭代提供算力支撑。

中间层是WorkBuddy加CodeBuddy的Agent框架。

应用层是腾讯文档、腾讯会议、企业微信、腾讯网盘等一系列产品。

腾讯庞大的 C 端和 B 端生态，让它天然具备场景红利，而场景和连接，决定一个Agent能进化到多高。

这一点，是腾讯的家底，别人羡慕不来。

七

最后说说我自己的感受。

我用腾讯文档加WorkBuddy一阵时间，除了开头说的那份Claude Code和Codex对比报告，我还试过让它帮我做行业数据整理、选题分析、AI论文抓取等。

整体体验下来就两个字：靠谱。

我喜欢用它，其中一个原因是它比较省心，交互上比较自然，成本也可控，不需要怎么折腾。

我想，经常整文档、PPT和Excel的白领，腾讯文档加WorkBuddy就是实用之选。

当然，也不是什么都好，有时候它的格式审美让人一言难尽，同时它对某些专业领域的理解深度和Claude和GPT的模型相比还有差距。

但方向对了。

AI办公的竞争已经走到了一个关键拐点。

很多单点的能力，大家都能做，接下来比的是：你的AI能在真实工作流里端到端把活干完并且完成交付吗？

从散装AI到套件级融合——这条路腾讯文档开了一个不错的头。

如果我们从更高一些的视角来看腾讯，会发现混元基座补齐、效率工具集成、Agent深度接入。

这些放在一起看，腾讯在AI办公这个战场上，确实在找到自己的节奏。

下一步就看混元的下一个大版本能不能在模型能力上再上一个台阶，以及人机双写这个品类能不能在用户端得到大规模验证了。

的确，为什么真正靠谱好用的AI Agent产品并不多？

原因其实很简单：Agent需要的技术栈要求太全面，缺一环，基本上就只能做个聊天机器人换皮。

腾讯这次的策略，就是是多层推进——

混元Hy3做基座，WorkBuddy做框架，腾讯文档做场景，网盘做数据底座，MCP加OpenAPI做开放通道。

有人可能会说，这不就是因为腾讯家大业大嘛，什么都有，拼起来就行了。

我倒是不这么看。

原因在于拼好也是有难度的：这些东西分属不同的产品线、不同的团队、不同的技术栈。

要让它们真正打通，需要顶层设计和执行力。

对于腾讯这样大厂而言，确实是不容易滴。

从这次腾讯文档的升级来看，至少在效率办公这个方向上，腾讯的劲在往一块使。

结语

我个人对厂商造词一向警惕，人机双写这个词能不能在行业里立住，还得看用户用脚投票。

但我愿意给它一个不错的评价，原因在于：对于没有极其复杂需求的日常办公一族，这是一个非常实用的工具。

腾讯这次给我的感觉，是终于在 Agent 这个战场上，找回了自己的手感。

它就守着自己的家底，把AI一点一点地原生融进去。

慢半拍没关系，关键是这一拍，踩在了点上。

——End——

作者简介：卫夕，公众号“卫夕指北”出品人，科技专栏作者，专写长文，专写不一样的，专注剖析AI、广告及互联网的底层逻辑；不关注这个账号，你都不知道你会错过神马！

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。