Codex 72%的用户不写代码，基模公司开始押注通用 Agent

发布时间：2026-06-04来源：Founder Park

Kimi 发布了 Kimi Work 的 Beta 测试版。

一个运行在本地的通用 Agent 产品，面向知识工作者，每天要做研究、整理数据、写报告、跑分析、管项目的人。

总算是等到了国内模型厂商发布的通用 Agent 产品了，而且是面向更大众用户的 GUI 版本，不再是程序员们喜欢的 TUI 界面。

这次没有发布独立的产品，在原有的 Kimi 桌面端的基础上，增加了 Agent 的交互界面，颇有点像 Claude Code 增加了 Cowork 的套路。

巧合的是，就在前一天，OpenAI 发布了一份关于 Codex 的知识工作报告。报告显示，Codex 周活突破 500 万，其中知识工作者的增速是开发者的 3 倍，已经占到用户总量的 20%。一个原本为程序员设计的工具，非程序员正在以更快的速度涌入。

国内外的模型公司，都意识到了面向普通用户的通用 Agent 产品的重要性了。

当然，也不只是 Kimi，国内的基模公司们，终于开始把模型能力、Agent 执行、工具调用和运行环境打包成面向普通知识工作者的产品，真正面向「不写代码的人」的 Agent 产品，终于来了。

体验方式：下载新版 Kimi 电脑客户端即可体验 Kimi Work，Mac 版已上线，WIndows 版本正在开发中。

⬆️关注 Founder Park，最及时最干货的创业分享

Founder Park 正在持续寻找值得被看见的 AI 团队与项目。

我们将通过「AI 产品市集」、内容报道、社群分发等方式，帮你触达早期用户、获得真实反馈，以及建立关键连接。

如果你正在做 AI 相关的事，欢迎和我们聊聊。

01 通用 Agent

是从 Coding Agent 长出来的

Kimi Work 的定位很明确，类比 OpenAI Codex 和 Claude Cowork。

它的内核来自 Kimi Code，Kimi 此前已经跑通的 Coding Agent，这基本已经是一条行业共识路径。Claude Cowork 从 Claude Code 长出来，Codex 也是从开发者工具扩展到知识工作，通用 Agent，几乎都是从 Code Agent 长出来的。

因为代码任务天然具备 Agent 需要的几个条件：目标相对明确，工具链成熟，结果可以运行，错误可以反馈，交付可以验收。相比于一般知识工作，代码是最容易形成完整执行闭环的场景。

Code Agent 先把「任务拆解、工具调用、并行执行、环境交付」这套能力跑通了，通用 Agent 再沿着这条路向更大的工作场景延伸。

过去一年，国内模型公司在 Coding Agent 赛道上跑得并不慢。

Kimi Code CLI 已经迭代了几十个版本，字节 Trae 成为全球亮眼的产品。智谱、阿里、百度、腾讯全线入场。可以说，Coding Agent 是国内模型公司过去一年真正跑通了的 Agent 产品形态。

但当下的 Code Agent 有一堵天然的墙：它的界面是终端和命令行，TUI 界面对非程序员来说几乎没法用。知识工作者需要的是他们熟悉的 GUI 界面。Kimi Work 做的产品化动作，就是把 Agent 从开发者环境搬进普通人的工作界面。

这也意味着，Kimi 过去在 Kimi Code、K2.5 到 K2.6 上积累的能力，不只是纯粹为了提升「写代码能力」。更准确地说，这是一套 Agent 产品能力：如何拆解复杂任务，如何调用多种工具，如何并行执行，如何在一个运行环境里完成交付。Kimi Work 是这套能力进入知识工作的产品化结果。

今天做通用 Agent 的条件也比一年前成熟了很多。模型能处理更长链条的任务规划，Agent 能完成更复杂的工具调用，运行环境从云端延伸到用户自己的本地电脑。更重要的是，经过过去一年 Vibe Coding 的普及，很多人已经建立了「调度 AI 来完成任务」的基本心智，不再把 AI 当聊天对象，而是可以交付结果的工作搭子。

有一个细节值得注意，官方宣称 Kimi Work 的 Beta 版是在一周内完成开发的，co-author 是 K2.6，整个项目累计产出约 5 万行有效代码，其中 92% 以上由 Kimi Code 自主生成。产品本身就在证明 Agent 的能力，这也是今天很多 Agent 产品开发和迭代的方式：Anthropic 用 Claude Code 开发 Claude Code，OpenAI 用 codex 开发 codex。

某种意义上，Agent 在自我迭代和进化。

通用 Agent 的成熟，不取决于模型能不能回答好问题，还取决于它能不能在真实环境里连续完成任务。Code Agent 先把这条路趟出来了，Kimi Work 则是将这条路延伸到知识工作的第一步。

02 从 Vibe Coding 到 Vibe Working，

是大势所趋

Vibe Coding 的核心，是人把编程意图交给 AI，把自己从具体代码执行中抽出来。Vibe Working 的核心也一样，知识工作者把研究、分析、整理、撰写、自动化和交付物生产交给 Agent，自己退到「调度和判断」的位置。

就在 Kimi Work 发布的前一天，OpenAI 发布了一份 Codex 知识工作报告，几个数据直接验证了这个方向：

Codex 周活跃用户超过 500 万，自 2 月桌面应用上线以来增长超过 6 倍。知识工作者约占用户的 20%，采用速度超过开发者 3 倍以上，非程序员才是增长最快的群体。他们用 Codex 清洗数据、做预测、生成报告、做产品原型、分析活动效果。72% 的知识工作者每周使用 Codex 产出文档、表格、报告等知识制品。

另一个关键信号是并行。约 50% 的 Codex 用户同时运行多个任务，这个比例在 4 月中旬还不到三分之一。用户不再一次做一件事，而是同时管理多条可审阅的工作流。

Codex 的数据说明，从 Vibe Coding 到 Vibe Working 扩大的是两件事：

用户群扩大了。从程序员和准程序员，延伸到金融分析师、研究员、内容工作者、运营、咨询顾问、管理者和创业者。这些人不会写代码，但每天都在做大量可以被 Agent 执行的知识工作。

任务边界扩大了。用户让 AI 做的事，从写一段代码或一篇稿子，扩展到找资料、整理数据、生成表格、搭建轻量工具、制作方案、检查结果、汇总交付物。任务的粒度更细，链条更长，组合更复杂。

OpenAI 在报告中还提出了一个值得注意的判断：知识工作的低效，核心不在于人不会生产内容，而在于上下文、工具和流程长期碎片化，工作者每天消耗大量时间在寻找信息、协调工具和验证结果上。通用 Agent 要解决的核心问题，不是帮人生成更多文档，而是减少这些隐藏成本。

Vibe Working 的真正变化，是知识工作者从执行任务，转向调度任务。当知识工作可以被拆成多条并行工作流，个人的产能也被会极大地提效。

03 最好的通用 Agent，

一定来自模型公司

回到产品本身。Kimi Work 的能力不只是强大的模型能力，而来自一系列组合能力：模型、并行、数据源、浏览器和本地电脑共同形成了一个可执行的工作环境。

模型底座是 K2.6。不用看参数和跑分，更重要的是 K2.6 在 Agent 工作流中的角色：理解用户的工作目标，拆出任务步骤，调用合适的工具，最终形成可验收的结果。

Kimi 从 2025 年 7 月发布万亿参数开源模型 K2 开始做 Agent 模型，9 月内测 Agent 模式（当时叫 OK Computer），到今天已经积累了将近一年的 Agent 产品经验。这是一方模型公司的结构性优势：模型能力和 harness 可以协同优化，第三方产品很难做到这一点。

并行能力也是 kimi 一直在做的。Kimi Work 上线即支持 Agent 集群，最多可以自主创建 300 个分身。AI 没必要沿着人类的串行工作习惯走，复杂任务可以被拆成多个工作流同时推进。这也是 Kimi 从 K2.5 模型就开始打磨的能力。

「能并行的，就不要串行。」

一个典型场景：一个投研分析师需要追踪 20 家公司的最新财报数据，交叉比对行业趋势，最终产出一份研究报告。过去这是一天甚至几天的工作量。在 Kimi Work 里，Agent 可以同时拆出多个分身，一边抓取财报，一边整理行业数据，一边起草报告框架，分析师的角色从埋头执行变成审阅和判断。

更好的数据源，金融数据源，代表高价值的行业上下文。Kimi Work 内置同花顺、天眼查、世界银行经济数据库等专业数据源。这个选择背后有一个产品判断：通用 Agent 想真正落地，光有通用能力不够，还需要先接入行业数据和行业工作流。

金融是一个合适的入口场景。金融工作高度依赖数据检索、交叉对比、趋势分析和报告生成，这些恰好是 Agent 最擅长的任务类型。对金融人士来说，一个出场就自带金融环境的 Agent 助手比自己购买 API、配置数据源和搭建基础分析流程要现实得多。Kimi 希望做到的是开箱即用：你大概率不会自己去配置这些基础设施，但类似的工作以后可以直接让 Kimi Work 帮你做。

通用 Agent 想真正落地，往往需要先接入行业数据和行业工作流。金融是一个合适的入口，但不会是唯一的入口。

当然还有今天必不可少的 Browser Use 能力，kimi 前一阵子上线了 Kimi WebBridge，它能直接操控你自己的浏览器，带着你自己的登录状态。

公众号「赛博禅心」在 Kimi Work 上线当天做一个测试，让 Kimi Work 抓取自己公众号后台全部 887 篇文章的数据，包括每篇的发布日期、标题、阅读数、点赞数、在看数和分享数。指令很简单，大意就是「打开我的公众号后台，把所有文章的数据整理出来，做一个可视化页面」。

这件事他之前也做过，用的是 Claude Code，在高铁上花了半个多小时，能跑通，但会更复杂一些，「得稍微懂一点前端和数据处理方向的知识」。

而 Kimi Work 的做法不同：接到任务后，它自己打开浏览器，发现数据是动态加载的，先尝试接口获取，发现信息不全，于是改为模拟人类逐页浏览，自主定位页面元素，逐条抓取数据。整个过程不需要用户写一行代码，也不需要懂页面结构。最终不仅抓完了 887 篇文章的全量数据，还自动生成了一套可交互的数据看板。

Agent 要成为工作工具，就必须进入用户已经在使用的工具环境。

长远点来看，最好的通用 Agent 产品，必然来自能做好模型与 Harness 协同的一方模型公司。

通用 Agent 的产品质量，取决于模型能力和 Harness 之间的深度协同。Agent 在真实环境里连续完成任务，每一步的成功率、容错能力、上下文保持、工具调用的准确性，都需要模型和 Harness 联合优化。第三方开发者可以调用 API，但无法调整模型与环境之间的配合方式。一方模型公司可以同时优化两端，模型更懂环境，环境更适配模型。

Claude Code 每次升级，第三方模型的适配可能就要调整一次；GPT-5.5 发布后，Codex 的能力获得飞速提升也是同样的原因；以及，这也是为什么，DeepSeek 开始招人做自己的 Agent 的原因。

想让自家的模型发挥最大的能力，一个适配自己的 harness 架构，对于模型公司来说也是必不可少的。

04 国内通用 Agent 的竞争，

正式开始了

视角拉远一些。

Kimi Work 并不是个例，国内通用 Agent 的竞争正在同时展开：豆包即将上线付费，字节也在把 Agent 能力从免费试探推向正式产品化；MiniMax Code 也在路上，从 Coding Agent 切入的路径和 Kimi 类似。

通用 Agent 不再只是海外大模型公司的产品叙事，国内基模公司也开始正式把 Code Agent 的能力迁移到真实知识工作场景。这个方向上，创新空间还很大。

这也许是 2026 年下半年 AI 竞争中最值得关注的方向转变。过去两年，国内基模公司的竞争主要发生在模型能力层面，跑分、参数、上下文长度、推理速度。这些当然重要，但它们是基础设施，不是产品。真正的产品竞争，发生在谁能让模型在用户的真实工作场景里持续运转、持续交付结果。

真正的模型即产品，不止取决于模型能力，还要看在模型之上，能交付出什么样的产品。

目前，Kimi Work 还在 Beta 阶段，还是个刚上线的产品。但国内基模公司已经开始把通用 Agent 当成正式产品来做了。

这个阶段的竞争才刚刚开始。谁能把模型能力、Agent 执行和真实工作环境协同得最好，谁就有可能在知识工作这个巨大场景里占住位置。

基模公司的下一场仗，在知识工作场景里。

更多阅读

美团领投、变量资本跟投，Mindverse总融资5000万美元，打造持续学习的Agent模型
Cursor Composer 2.5 拆解：最强大的 RL 环境，就是你自己的产品
拆解 Anthropic：最好的 AI 公司，可能也是一种组织发明
AGI Playground 2026，欢迎来新加坡！

转载原创文章请添加微信：founderparker

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。