Codex 72%的用户不写代码,基模公司开始押注通用 Agent

Kimi 发布了 Kimi Work 的 Beta 测试版。
一个运行在本地的通用 Agent 产品,面向知识工作者,每天要做研究、整理数据、写报告、跑分析、管项目的人。
总算是等到了国内模型厂商发布的通用 Agent 产品了,而且是面向更大众用户的 GUI 版本,不再是程序员们喜欢的 TUI 界面。
这次没有发布独立的产品,在原有的 Kimi 桌面端的基础上,增加了 Agent 的交互界面,颇有点像 Claude Code 增加了 Cowork 的套路。

巧合的是,就在前一天,OpenAI 发布了一份关于 Codex 的知识工作报告。报告显示,Codex 周活突破 500 万,其中知识工作者的增速是开发者的 3 倍,已经占到用户总量的 20%。一个原本为程序员设计的工具,非程序员正在以更快的速度涌入。
国内外的模型公司,都意识到了面向普通用户的通用 Agent 产品的重要性了。
当然,也不只是 Kimi,国内的基模公司们,终于开始把模型能力、Agent 执行、工具调用和运行环境打包成面向普通知识工作者的产品,真正面向「不写代码的人」的 Agent 产品,终于来了。
体验方式:下载新版 Kimi 电脑客户端即可体验 Kimi Work,Mac 版已上线,WIndows 版本正在开发中。
Founder Park 正在持续寻找值得被看见的 AI 团队与项目。
我们将通过「AI 产品市集」、内容报道、社群分发等方式,帮你触达早期用户、获得真实反馈,以及建立关键连接。
如果你正在做 AI 相关的事,欢迎和我们聊聊。
01
通用 Agent
是从 Coding Agent 长出来的
Kimi Work 的定位很明确,类比 OpenAI Codex 和 Claude Cowork。
它的内核来自 Kimi Code,Kimi 此前已经跑通的 Coding Agent,这基本已经是一条行业共识路径。Claude Cowork 从 Claude Code 长出来,Codex 也是从开发者工具扩展到知识工作,通用 Agent,几乎都是从 Code Agent 长出来的。
因为代码任务天然具备 Agent 需要的几个条件:目标相对明确,工具链成熟,结果可以运行,错误可以反馈,交付可以验收。相比于一般知识工作,代码是最容易形成完整执行闭环的场景。
Code Agent 先把「任务拆解、工具调用、并行执行、环境交付」这套能力跑通了,通用 Agent 再沿着这条路向更大的工作场景延伸。
过去一年,国内模型公司在 Coding Agent 赛道上跑得并不慢。
Kimi Code CLI 已经迭代了几十个版本,字节 Trae 成为全球亮眼的产品。智谱、阿里、百度、腾讯全线入场。可以说,Coding Agent 是国内模型公司过去一年真正跑通了的 Agent 产品形态。
但当下的 Code Agent 有一堵天然的墙:它的界面是终端和命令行,TUI 界面对非程序员来说几乎没法用。知识工作者需要的是他们熟悉的 GUI 界面。Kimi Work 做的产品化动作,就是把 Agent 从开发者环境搬进普通人的工作界面。
这也意味着,Kimi 过去在 Kimi Code、K2.5 到 K2.6 上积累的能力,不只是纯粹为了提升「写代码能力」。更准确地说,这是一套 Agent 产品能力:如何拆解复杂任务,如何调用多种工具,如何并行执行,如何在一个运行环境里完成交付。Kimi Work 是这套能力进入知识工作的产品化结果。
今天做通用 Agent 的条件也比一年前成熟了很多。模型能处理更长链条的任务规划,Agent 能完成更复杂的工具调用,运行环境从云端延伸到用户自己的本地电脑。更重要的是,经过过去一年 Vibe Coding 的普及,很多人已经建立了「调度 AI 来完成任务」的基本心智,不再把 AI 当聊天对象,而是可以交付结果的工作搭子。
有一个细节值得注意,官方宣称 Kimi Work 的 Beta 版是在一周内完成开发的,co-author 是 K2.6,整个项目累计产出约 5 万行有效代码,其中 92% 以上由 Kimi Code 自主生成。产品本身就在证明 Agent 的能力,这也是今天很多 Agent 产品开发和迭代的方式:Anthropic 用 Claude Code 开发 Claude Code,OpenAI 用 codex 开发 codex。
某种意义上,Agent 在自我迭代和进化。
通用 Agent 的成熟,不取决于模型能不能回答好问题,还取决于它能不能在真实环境里连续完成任务。Code Agent 先把这条路趟出来了,Kimi Work 则是将这条路延伸到知识工作的第一步。
02
从 Vibe Coding 到 Vibe Working,
是大势所趋
Vibe Coding 的核心,是人把编程意图交给 AI,把自己从具体代码执行中抽出来。Vibe Working 的核心也一样,知识工作者把研究、分析、整理、撰写、自动化和交付物生产交给 Agent,自己退到「调度和判断」的位置。
就在 Kimi Work 发布的前一天,OpenAI 发布了一份 Codex 知识工作报告,几个数据直接验证了这个方向:
Codex 周活跃用户超过 500 万,自 2 月桌面应用上线以来增长超过 6 倍。知识工作者约占用户的 20%,采用速度超过开发者 3 倍以上,非程序员才是增长最快的群体。他们用 Codex 清洗数据、做预测、生成报告、做产品原型、分析活动效果。72% 的知识工作者每周使用 Codex 产出文档、表格、报告等知识制品。

另一个关键信号是并行。约 50% 的 Codex 用户同时运行多个任务,这个比例在 4 月中旬还不到三分之一。用户不再一次做一件事,而是同时管理多条可审阅的工作流。
Codex 的数据说明,从 Vibe Coding 到 Vibe Working 扩大的是两件事:
用户群扩大了。从程序员和准程序员,延伸到金融分析师、研究员、内容工作者、运营、咨询顾问、管理者和创业者。这些人不会写代码,但每天都在做大量可以被 Agent 执行的知识工作。
任务边界扩大了。用户让 AI 做的事,从写一段代码或一篇稿子,扩展到找资料、整理数据、生成表格、搭建轻量工具、制作方案、检查结果、汇总交付物。任务的粒度更细,链条更长,组合更复杂。
OpenAI 在报告中还提出了一个值得注意的判断:知识工作的低效,核心不在于人不会生产内容,而在于上下文、工具和流程长期碎片化,工作者每天消耗大量时间在寻找信息、协调工具和验证结果上。通用 Agent 要解决的核心问题,不是帮人生成更多文档,而是减少这些隐藏成本。
Vibe Working 的真正变化,是知识工作者从执行任务,转向调度任务。当知识工作可以被拆成多条并行工作流,个人的产能也被会极大地提效。
03
最好的通用 Agent,
一定来自模型公司
回到产品本身。Kimi Work 的能力不只是强大的模型能力,而来自一系列组合能力:模型、并行、数据源、浏览器和本地电脑共同形成了一个可执行的工作环境。
模型底座是 K2.6。不用看参数和跑分,更重要的是 K2.6 在 Agent 工作流中的角色:理解用户的工作目标,拆出任务步骤,调用合适的工具,最终形成可验收的结果。
Kimi 从 2025 年 7 月发布万亿参数开源模型 K2 开始做 Agent 模型,9 月内测 Agent 模式(当时叫 OK Computer),到今天已经积累了将近一年的 Agent 产品经验。这是一方模型公司的结构性优势:模型能力和 harness 可以协同优化,第三方产品很难做到这一点。
并行能力也是 kimi 一直在做的。Kimi Work 上线即支持 Agent 集群,最多可以自主创建 300 个分身。AI 没必要沿着人类的串行工作习惯走,复杂任务可以被拆成多个工作流同时推进。这也是 Kimi 从 K2.5 模型就开始打磨的能力。
「能并行的,就不要串行。」
一个典型场景:一个投研分析师需要追踪 20 家公司的最新财报数据,交叉比对行业趋势,最终产出一份研究报告。过去这是一天甚至几天的工作量。在 Kimi Work 里,Agent 可以同时拆出多个分身,一边抓取财报,一边整理行业数据,一边起草报告框架,分析师的角色从埋头执行变成审阅和判断。
更好的数据源,金融数据源,代表高价值的行业上下文。Kimi Work 内置同花顺、天眼查、世界银行经济数据库等专业数据源。这个选择背后有一个产品判断:通用 Agent 想真正落地,光有通用能力不够,还需要先接入行业数据和行业工作流。
金融是一个合适的入口场景。金融工作高度依赖数据检索、交叉对比、趋势分析和报告生成,这些恰好是 Agent 最擅长的任务类型。对金融人士来说,一个出场就自带金融环境的 Agent 助手比自己购买 API、配置数据源和搭建基础分析流程要现实得多。Kimi 希望做到的是开箱即用:你大概率不会自己去配置这些基础设施,但类似的工作以后可以直接让 Kimi Work 帮你做。
通用 Agent 想真正落地,往往需要先接入行业数据和行业工作流。金融是一个合适的入口,但不会是唯一的入口。

当然还有今天必不可少的 Browser Use 能力,kimi 前一阵子上线了 Kimi WebBridge,它能直接操控你自己的浏览器,带着你自己的登录状态。
公众号「赛博禅心」在 Kimi Work 上线当天做一个测试,让 Kimi Work 抓取自己公众号后台全部 887 篇文章的数据,包括每篇的发布日期、标题、阅读数、点赞数、在看数和分享数。指令很简单,大意就是「打开我的公众号后台,把所有文章的数据整理出来,做一个可视化页面」。
这件事他之前也做过,用的是 Claude Code,在高铁上花了半个多小时,能跑通,但会更复杂一些,「得稍微懂一点前端和数据处理方向的知识」。
而 Kimi Work 的做法不同:接到任务后,它自己打开浏览器,发现数据是动态加载的,先尝试接口获取,发现信息不全,于是改为模拟人类逐页浏览,自主定位页面元素,逐条抓取数据。整个过程不需要用户写一行代码,也不需要懂页面结构。最终不仅抓完了 887 篇文章的全量数据,还自动生成了一套可交互的数据看板。
Agent 要成为工作工具,就必须进入用户已经在使用的工具环境。
长远点来看,最好的通用 Agent 产品,必然来自能做好模型与 Harness 协同的一方模型公司。
通用 Agent 的产品质量,取决于模型能力和 Harness 之间的深度协同。Agent 在真实环境里连续完成任务,每一步的成功率、容错能力、上下文保持、工具调用的准确性,都需要模型和 Harness 联合优化。第三方开发者可以调用 API,但无法调整模型与环境之间的配合方式。一方模型公司可以同时优化两端,模型更懂环境,环境更适配模型。
Claude Code 每次升级,第三方模型的适配可能就要调整一次;GPT-5.5 发布后,Codex 的能力获得飞速提升也是同样的原因;以及,这也是为什么,DeepSeek 开始招人做自己的 Agent 的原因。
想让自家的模型发挥最大的能力,一个适配自己的 harness 架构,对于模型公司来说也是必不可少的。
04
国内通用 Agent 的竞争,
正式开始了
视角拉远一些。
Kimi Work 并不是个例,国内通用 Agent 的竞争正在同时展开:豆包即将上线付费,字节也在把 Agent 能力从免费试探推向正式产品化;MiniMax Code 也在路上,从 Coding Agent 切入的路径和 Kimi 类似。
通用 Agent 不再只是海外大模型公司的产品叙事,国内基模公司也开始正式把 Code Agent 的能力迁移到真实知识工作场景。这个方向上,创新空间还很大。
这也许是 2026 年下半年 AI 竞争中最值得关注的方向转变。过去两年,国内基模公司的竞争主要发生在模型能力层面,跑分、参数、上下文长度、推理速度。这些当然重要,但它们是基础设施,不是产品。真正的产品竞争,发生在谁能让模型在用户的真实工作场景里持续运转、持续交付结果。
真正的模型即产品,不止取决于模型能力,还要看在模型之上,能交付出什么样的产品。
目前,Kimi Work 还在 Beta 阶段,还是个刚上线的产品。但国内基模公司已经开始把通用 Agent 当成正式产品来做了。
这个阶段的竞争才刚刚开始。谁能把模型能力、Agent 执行和真实工作环境协同得最好,谁就有可能在知识工作这个巨大场景里占住位置。
基模公司的下一场仗,在知识工作场景里。


美团领投、变量资本跟投,Mindverse总融资5000万美元,打造持续学习的Agent模型
Cursor Composer 2.5 拆解:最强大的 RL 环境,就是你自己的产品
拆解 Anthropic:最好的 AI 公司,可能也是一种组织发明
AGI Playground 2026,欢迎来新加坡!
转载原创文章请添加微信:founderparker
