从Manus到Claude Code:Agent正在经历一场"六阶段"范式转移 | GAIR Live 027

作者丨岑峰

过去一年,日新月异的Agent 赛道完成了一轮螺旋式上升的范式循环:
2025 年 3 月,Manus 以三级结构落地,首次将 “数字化员工” 产品化,完成了全行业的用户启蒙;
随后 OpenClaw 凭借本地化部署、数据主权与轻量化体验迅速爆火,验证了市场对 AI 操控电脑(Computer Use)的真实付费意愿;
近期,Anthropic 携原生系统级能力的 Claude Code 强势入场,以底层架构优势冲击工业级市场。
三款现象级产品接连引爆,标志着 Computer Use 已成为大厂与创业者的核心战场,Agent 发展正式从 “单体能力比拼” 进入 “系统工程与生态卡位” 的深水区。
"这说明了Agent的演进不是线性的,而是螺旋式上升的。"在GAIR Live第27期的圆桌讨论中,OpenManus核心贡献者张佳钇这样评价。就在Claude Code发布的同一时期,Manus、OpenClaw、Codex等Agent产品密集涌现,整个行业仿佛在一夜之间进入了"深水区"。
这场由OpenManus 主要贡献者张佳钇、Nanponova AI 创始人兼 CEO 常楠两位实战派嘉宾共同参与的对话,试图回答一个核心问题:当Agent从Demo走向生产环境,从技术尝鲜走向工业级应用,创业者的真正壁垒究竟何在?
答案或许藏在张佳钇提出的"六阶段"理论中,也可能藏在常楠所说的"脏活累活"里。但有一点是确定的:Agent 竞争已从模型智力的单点突破,转向工程能力、场景落地、数据主权、生态构建的全方位较量,螺旋上升的背后,是能力、产品、商业、生态四重逻辑的同步重构。

01
Manus、OpenClaw、Claude Code 的定位与跃迁
Agent 产业的爆发并非无序狂奔,而是遵循清晰的阶段化规律。张佳钇基于其提出的Agent 发展六阶段论,为当前三款现象级产品划定了精准的技术坐标,也厘清了行业螺旋进击的内在逻辑。
反直觉的是,不同于部分自媒体“Claude Code全面‘龙虾化’”的总结,他提出技术演进顺序应为 Claude Code/CodeX 在前,OpenClaw 在后 —— 正是 Claude Code 等工具验证了 Coding 与系统操控的极强可用性,才催生 OpenClaw 将能力从开发者群体延伸至普通非开发者用户,完成了大众化市场的渗透。
02
Computer Use 成为核心战场
OpenClaw 的爆火,本质是市场对本地操作、数据主权、隐私可控需求的集中释放,也让 Computer Use 正式成为 Agent 竞争的核心赛道。而这一赛道的崛起,既是模型能力突破的必然,也是旧 API 自动化范式走到尽头的结果。
常楠直言,Computer Use 解决的是人机交互的 “历史遗留问题”:过去所有软件都为人类设计,GUI 统治生态;而 Agent 时代,交互正在向计算机原生的 CLI 形态回归。未来应用会拥有两套接口,即保留 GUI 供人类使用,同时搭建 AI 专属原生接口。而当前 Computer Use 的爆发,核心驱动力是多模态大模型(VLM)的技术成熟,视觉能力与系统操作能力结合,让模型代劳的工作范围呈几何级扩张。
当前 Computer Use 形成两条核心技术路线:基于视觉 VLM 模拟点击(OpenClaw 路线)、通过原生指令集系统接管(Claude Code 路线)。海外平台接口开放,原生指令集效率更高;国内内容生态高度封闭,视觉方案成为跨越 “围墙花园” 的主要渠道。张佳钇补充,Computer Use 的核心是为 Agent 获取更多上下文与权限,CLI 方案在专业场景效率更高,而视觉 VLM 是更通用的能力,能覆盖海量未知长尾场景。长路径决策的幻觉积累是最大技术难点,巨头在强化学习数据上占据优势,而 Claude Code 走出的 “视觉 + 系统指令” 混合模式,成为全行业可借鉴的方向。
03
Coding 是 Agent 的 “第一性原理”:
自主造工具才是真智能
在本轮范式演进中,Coding 的核心地位被反复强调,两位嘉宾一致认为:Coding 是 Agent 扩展能力边界的第一基石,是 Agent 的第一性原理。
常楠高度认可 Anthropic 的路径:编程不只是写代码,而是系统级问题解决。当 Agent 能在现有工具不足时自主编程创造新工具,才真正具备工业级价值,这也是区分 “单纯效率工具” 与 “真正智能体” 的分水岭。相比简单的屏幕识别和模拟点击,能够理解系统底层逻辑并生成执行代码的 Agent,才能支撑复杂任务、长程执行与跨场景协作。
2025 年初 Claude Code 初版受限于基座能力,随着模型迭代,Agent 架构从 Manus 式的 “手工流” 快速升级为深度 “智能体流”。未来理想场景是Agent 网络:向网络发布任务,现有 Agent 无法完成时,自动协作并自主编写新工具解决问题,这正是 Coding 作为第一性原理的终极体现。
04
效率工具创业者面临 “降维打击”,
垂直场景迎来红利
范式的快速演变,对一线创业者带来了生存空间的剧烈波动,行业呈现两极分化。
常楠判断:基模公司必然从售卖 Token 延伸至产品侧与效率侧,纯效率工具类创业者将面临降维打击;而垂直场景应用开发者则迎来重大利好。他的团队围绕 Claude Code 构建 Skill Set 与 Harness,实现从需求分析、PRD 生成、TDD 到代码编写的全链路自动化,原本一两个月的交付周期压缩至一周,效能提升呈指数级。
同时,企业需求的分化进一步加剧行业格局:大型企业极度看重过程可审计、数据私有化,倾向私有化部署;中小企业与个人用户更看重便利性,愿意适度让渡隐私。中国与海外的生态差异,也让 OpenClaw 这类轻量化、本地化产品在国内获得远超硅谷的热度。
05
Agent 的下一轮爆发点:
从模型智力到系统工程
圆桌的最后,两位嘉宾共同指向一个核心结论:Agent 竞争已彻底从 “模型智力” 转向 “系统工程能力”,VLM 与 CLI 路线、开源与闭源、通用与垂直,最终都要回归 “为用户创造真实价值” 的本质。
张佳钇预判了 Agent 的两大未来方向:一是个性化学习,Agent 从交互中学习个人偏好,行业急需建立个人偏好与智能体行为关联的数据标准;二是智能体网络(Agent Network),企业内智能体获得全员权限,处理文档、会议、协作,推动组织向 AI Native 转型;社会层面,个人知识技能通过 Agent 资产化、可交易,智能体间实现自动任务定价,这一方向将在近几个月迎来重大机会。
而整个产业的螺旋进击,最终会走向一个清晰的终局:模型厂商聚焦底层能力与生态构建,开源社区负责轻量化创新与用户体验补全,创业者深耕垂直场景与行业 Know-how,三方形成互补共生的生态。Manus 完成启蒙,OpenClaw 验证需求,Claude Code 定义工业级标准,三者共同推开了 Agent 时代的大门,而真正的产业变革,才刚刚开始。
以下是本次圆桌的实录,AI 科技评论进行了不改原意的编辑:

岑峰(主持人):欢迎来到雷峰网AI科技评论主办的GAIR Live线上圆桌。最近一年,Agent 领域正经历一场螺旋式上升:
2025 年 3 月,Manus 以三级结构亮相,将“数字化员工”概念首次产品化并完成了用户启蒙;随后,OpenClaw 凭借本地化与数据主权优势爆火,验证了用户对 AI 操控电脑(Computer Use)的付费意愿。近期,Anthropic 携带具备原生接管能力的 Claude Code 杀入战场,试图利用系统级优势进行工业级收割。
这三款现象级产品的崛起,标志着“Computer Use”已成为大厂与创业者竞争的核心战场。今天我们请到了这一领域的两位顶尖实战者:OpenManus的主要贡献者张佳钇,以及Agent领域的资深创业者、Nanponova AI的创始人CEO常楠和我们一起讨论。
佳钇曾提出过 Agent 发展的“六阶段论”,在这个理论框架下,我们如何看待当前的范式演进?三款现象级产品,分别处于你那六个阶段当中的怎样的位置?
张佳钇:我先回顾一下我们之前说的六个阶段。当时我们想的是,第一个阶段是说纯粹的对语言模型去做调用;第二个阶段是要去做Agent for Flow;第三个阶段是能够跨环境的Financial Agent;第四个阶段是Agent for Coding;第五个阶段是真正每一个人拥有自己的Agent;第六个阶段是Agent Network,能够去跟其他人去做定价和交流。
Manus 处于“预定义环境自主 Agent”阶段,其目标、环境权限均由人类预设。反直觉的是,我认为演进顺序应该是 Claude Code 与 CodeX 在前,OpenClaw 在后。正是因为 Claude Code 等工具展现了极强的可用性,才催生了 OpenClaw 进一步将该能力从开发者群体引向非开发者领域。
我是CodeX的重度用户,从个人体感来看,其能力经历了两次显著的跃迁:
1.2025 年 9 月: 当时的工具已能完成约 80% 的科研代码工作,能够支持三至四小时的长程执行。
2.2025 年 12 月: 长程执行能力进一步增强,且代码产出质量较上一版本有质的飞跃。
再到下一个阶段,可能是Codex 5.4,或者说是Opus他们最近出的Computer Use功能。在这样的情况之下,我们会注意到Agent已经实现了一个非常Native的通过Bash的工具,能够去同时地对文本、对Code、对GUI环境去做处理,也能够通过OS指令直接操控屏幕,也会有一些多模态的UI点击操作。这个时候意味着模型本身已经进入了一个能够同时很好地去做不同环境任务处理的空间。
岑峰: 佳钇划定了技术坐标,但坐标变迁对一线创业者意味着生存空间的波动。常楠老师,Manus 火热时,大家在争论“Agent APP”是否为终极形态。但现在看,后面又出现了OpenClaw和Claude Code这样的形态。这一年来的范式演变对追求落地的创业者产生了哪些影响?
常楠:我跟佳钇感受还是蛮近的。我从 2024 年底开始使用 Cursor,见证了 AI 编程从自动补全到 Agent 化的过程。2025 年初 Claude Code 第一个版本受限于基模能力,但随着模型增强,Agent 架构从早期的“手工流”(如 Manus)演进为深度的“智能体流”。
我非常认可 Anthropic 的路径。编程不仅是写代码,更是系统级问题。它解决了 Agent 在发现现有工具不足时,如何通过自主编程创造新工具来完成任务。因此,Coding 是 Agent 扩展能力边界的第一基石。
在 2025 年 9 月至 10 月期间,我开始将 Claude Code 与现有工作流结合。
对于非效率工具类的创业者,这种系统级能力的提升是巨大的赋能。我们围绕 Claude Code 构建了一套 Skill Set 和 Harness:
▪ 全链路自动化: 从需求分析、设计文档、PRD 生成到 TDD(测试驱动开发)及代码编写。
▪ 效能提升: 模型直接调用 CLI 工具进行自动化测试与回归测试。原本需要一两个月交付的成果,现在一周即可完成。
我的判断是:基模公司必然从售卖 Token 延伸至产品侧与效率侧,这会让纯效率工具类的创业者感到焦虑,但对像我这样做垂直场景的应用开发者则是极大利好。
岑峰:OpenClaw 的爆火证明了用户对本地操作及隐私主权的看重。在商业落地中,客户更在意Agent能“独立完成任务”,还是在“视线范围内受控干预”?
常楠:这取决于具体的应用场景。大型企业对“过程可审计性”极度看重。商业场景对确定性要求极高,企业不希望系统是黑盒,必须确保过程可追溯。此外,数据和工作流是企业的核心私有资产,大公司不愿将其暴露给外部模型厂商,因此更倾向于私有化部署。
相比之下,部分中小企业或个人用户更愿意为了便利性牺牲一定隐私。因为在他们的某些领域里面,他们没有非常私有的工作流,或者不太了解这些Knowhow,他们可能没有那么关注这件事。
值得注意的是,中国用户在移动互联网时代已习惯于用隐私交换便利,而海外用户则更为敏感。这种生态差异也解释了为何OpenClaw在中国引发的热潮比在硅谷更强烈。
我认为Coding能力的提升是延展模型能力的基础。Anthropic当时的设想或许是:当Agent发现任务无法完成时,能够自主编写工具来解决问题。未来可能形成一个Agent网络,不同Agent之间通过自主协作完成工具开发与任务分发。这与单纯的OpenClaw模式在底层逻辑上仍存在差异。
岑峰:你刚才提到,你很确定Anthropic的路径是正确的。可以稍微展开吗?
常楠:2025 年初与 Anthropic 交流时,我意识到他们的逻辑非常前瞻:Coding 是一切能力的延展。未来的理想场景是一个“Agent 网络”:当你向网络发布一个 Job 或 Task,如果现有的 Agent 无法直接完成,它们会自动协作并“自主编写”出一个新工具来解决问题。
这种“自主创造工具”的能力,是区分单纯“效率工具”与真正“智能体”的分水岭。这也是为什么 Coding Agent 在这一轮竞争中占据了绝对的制高点。相比简单的屏幕识别和模拟点击,能够理解系统底层逻辑并生成执行代码的 Agent,才具备真正的工业级价值。
岑峰:效率和主权永远是客户在不同场景当中需要权衡的一个因素。说到这个,开源社区会是一个有力的补充。回想当初Manus之后,社区迅速地出现了OpenManus。佳钇,当时你也提到OpenManus更像是一个中间性的意外产物。今天面对Claude Code这样一个具备OS级原生权限的正规军,开源社区的竞争策略又会是怎么样的?
张佳钇:OpenManus当时确实是一个比较粗暴的中间东西。关键是在现在这样的情况之下,开源这边要怎么样来跟Claude Code去互补。OpenClaw本身就已经给了一个很好的例子,就是通过非常快速迭代去增加,能够让用户更多实际使用上体感更多的功能。OpenClaw做好的一点就是它可能通过非常多能够让你在真实生活中很方便地去做一些事情,通过这个东西来抢占用户的心智,相比Claude Code可能有一个更迅猛的流量入口。
开源项目也是要考虑一样的事情。如果只做开源,很难能够预测模型能力本身的发展方向,可能更多能做的事情还是要从大家实际去使用的体验去入手。
比如说最近我觉得有个非常好的开源项目叫OpenCLI,它会去把小红书、推特,包括还有一些其他的软件变成一个自动CRA工具,大家直接开箱就能用。虽然它本身不涉及非常多非常炫的概念,但是因为它本身是解决用户的一个问题,所以本身也是得到了非常多的关注跟声量。
如果到后面要做什么,可能还是要去做让用户本身更好用的功能。虽然这个东西可能也会很快被吃掉,但是带来的信任,它可能是不太会被砍掉的。
岑峰: 佳钇的意思也就是来更好地贴近用户的需求,来和正规军来做互补,打一个时间差。我们现在聊具体的技术,常楠,从你的观察看,为什么这一年的Agent竞争中Computer Use会处于如此核心的地位?究竟是因为模型的能力到了一定的新高度,还是说旧的API自动化范式已经到了尽头?
常楠: Computer Use 的崛起本质上是在解决一个“历史遗留问题”。过去所有的软件和应用都是为人类设计的,GUI(图形用户界面)统治了人机交互生态。现在,为 Agent 准备的工具正在回归计算机创建之初的 CLI(命令行界面)形态。
我很早有过预判,未来的应用将拥有两套接口:一套是保留 GUI ,供人和机器同时使用,另一套则是专门给 AI 调用的原生接口。当前 Computer Use 能力的提升,主要得益于多模态大模型(VLM)技术的发展。大厂在探索原生多模态模型时,将其视觉能力与操作能力的结合是极其自然的演化。当模型能够通过视觉操作人类遗留的应用时,它能代劳的工作范围将呈几何倍数增长。
岑峰: 常楠提到未来人和AI会有一个一个磨合的过程,目前 Computer Use 存在两条主要路径:一类是基于视觉 VLM 模拟点击(如 OpenClaw),另一类是通过原生指令集接管系统(如 Claude Code)。这两条路径分别适用于哪些行业场景?
常楠: 这取决于要解决的具体问题。在海外,平台接口相对开放,付费即可获取大量数据接口。但在国内,如小红书等内容生态通常是封闭的,公司将数据视为核心资产,不愿提供公开的 API 或 CLI 接口。在这些封闭场景下,视觉方案就变得极具意义,因为这是跨越“围墙花园”获取数据、完成工作的唯一渠道。
岑峰: 佳钇经常和开发者打交道,遇到的这样的场景的问题应该也会更多。你还有什么补充吗?
张佳钇:我认为 Computer Use 的核心在于帮助 Agent 获得更多的“上下文”与“权限”。无论是走 OS 脚本路径还是纯 UI 点击路径,本质都是为信息获取服务。
在我们自己实际Computer Use工具的内部开发中,大家更关注通过 Computer Use 实现社媒操作或自动化审批流程。如果你有更好的CLI,在特定专家场景下效率更高,但视觉方案的Computer Use是一种更通用的能力,它不依赖于具体的接口开发,能覆盖大量未知的长尾场景。
岑峰: Computer Use 的技术难点在于长路径决策中的幻觉积累,第一步点错,后面步步皆错。现在巨头在强化学习数据规模上占尽优势,是否会让开源社区处于一个追赶的状态?
张佳钇:我觉得可能不能说是开源社区,可能整个非“御三家”(DeepSeek、Qwen、Kimi)之外的公司,大家都要去解这个事情。首先这个地方其实是关于一个数据规模的问题。Computer Use的任务一般分为两类,第一类是怎么样去做导航(Navigation),即长程规划;第二类是怎么样来做对齐(Grounding),怎么样来对一个准确的元素点击页面元素。
2025年整个学术界和工业界,基本上都是围绕如何获取更多的视觉数据展开。如字节的UI Task项目,他们标注了非常多的Computer Use数据。我们则是Code Agency来从头到尾地构建一个Web AP,利用应用的状态机提取它完整的轨迹,来得到更多的数据。数据规模确实是一个很大的问题,大家都是在去尝试做这种数据的补充。
Claude Code(基于 CodeX 5.4)是一个重要的分水岭。巨头开始有意识地在纯 UI 操作中揉入增强版 Bash 操作。这种“视觉+系统指令”的混合模式改变了数据分布。虽然我们处于追赶位,但这种通过系统底层能力提升效率的路径,是开源社区可以借鉴并实现的。
岑峰: OpenClaw 火爆,很大程度上是因为它提供了本地部署和深度权限。如果未来开源项目也走向云端托管,相比 Claude Code 这种原生集成产品,优势还剩什么?
张佳钇: OpenClaw 的价值在于它“侵入”了更多的本地权限,从而获得了极其丰富的个人上下文,这让它比云端 Agent 更“好用”。
云端托管对然方便,但差别在于,如果缺乏完整的权限支持,它的个性化做的没有那么好,可能更多还是一个更General的Agent助手。这种情况下我觉得它不一定会比Manus那种产品体验会做得更好。虽然本身我们也可以去做这种线上的调教,但没有本地权限的话,可能有些事情没有那么方便。
主持人: 最近发生了 Claude Code 源代码泄露的重磅事件。从技术角度看,这是否可以看作是给开源社区的一份“大礼包”?
张佳钇: Claude Code 代码对开源社区来说肯定是有借鉴意义的。Claude Code 的工程实现非常出色,代码比 OpenClaw 简洁许多。它在上下文压缩、脚手架(Scaffold)设计上的思路对开源项目有很强的借鉴意义,能帮大家快速补齐一些 Feature。
但从学术和核心竞争力的角度来看,脚手架本身并不是最终的决胜点,也不是闭源大厂真正的护城河。大家公认的闭源壁垒,依然在于其背后庞大的强化学习数据和训练闭环。这份代码虽然有参考价值,但并没有想象中那样能产生颠覆性的影响。
岑峰:佳钇提到 Claude Code 泄露的代码中包含了大量工程套路和策略指令,这是否验证了你此前关于“工程系统能力在 Agent 演进中至关重要”的判断?未来 Agent 的演化方向会是什么?
张佳钇:我自己想做的一个点,是Agent应该能够去从你跟它的交互之中去个性化学习。目前行业缺乏成体系的个人偏好与智能体行为关联的数据标准(Bench)。如果 Agent 能够从与个人的交互中持续学习并优化行为,将带来质的改进。
其次,“智能体网络”有望在近几个月内迎来重大机会。在企业内部,如果你使用如飞书、Slack 等协作工具,里面会有很多文档信息、对话信息、会议、与同事的协作等数据内容,智能体若能获得与真人同等的权限,去处理文档、对话及日常会议,就能构建出一套员工间的智能体协作网络。这本质上是企业向“AI Native 组织”的转型。
从社会角度看,每个人的独特知识和技能未来可以通过 Agent 进行“资产化”并对外售卖。我们现在更多还是通过人与人联系这样的形式,未来Agent 之间甚至能实现自动任务定价。虽然这种模式在短期内不会完全成熟,但应该会有这样的项目出现。
岑峰: 最近“将离职员工炼化为数字化员工”的说法很火。常楠老师,在商业落地中,这种“知识蒸馏”是否已经从自媒体想象进入了实操阶段?
常楠: 在传统大型组织中,这种“蒸馏”其实一直以岗位备份和文档交接的形式存在,没有任何一个人是完全独享同一个岗位的知识,一定有一个Backup,这本身也是一种知识的蒸馏,以前在隐性里面就已经都存在了。
现在的技术让这种过程变得更智能、更具象。但我认为,相对于内化到模型中的能力,“持续学习能力”可能才是更重要的,他已经研究出来的知识可以沉淀下来,但可能很快就会扩散失去价值,持续学习的能力才是核心资产。
另外像人脉关系,销售的关系能力有时候也是很难沉淀、很难被模型蒸馏出来的,其价值在于无法被接管的客户信任关系。因此,数字化员工可能在重复性岗位上有意义,但对于核心人才的替代作用有限。
岑峰: 闭源巨头一直主打安全与免运维,但 Claude Code 源码泄露事件暴露了其脆弱性。这是否会动摇企业对闭源托管方案的信任?
常楠: 私有化部署一定是有大量市场的,但是这个成本商业成本非常高。信任与部署方案之间存在一个“光谱”,可能都会有各种生态的存在:大型企业拥有资金和 AI 团队,出于对代码主权和可审计性的考虑,一定会追求私有化部署。而中小企业受限于算力、成本和工程能力,云端方案依然是极其廉价且高效的替代品。
所以并非一个绝对的选择题,它是一个有灰度的问题。在不同的场景下,根据不同公司的状态,还有他们业务的状态,实现业务状态和成本敏感度的动态平衡。
岑峰: 现在巨头的底牌被看清之后,Agent创业者会不会迎来一个平权的时代?如果真的有一个平权时代的到来,这对创业者会有怎样的机会呢?
常楠: 我同意佳钇刚才说的,Claude Code代码泄露可能有一定的价值,但它也不是绝对的价值。你要说平权,我觉得也不一定平权,因为模型能力本身还是决定了产品的上限,而工程能力决定了产品的下限。如果基座模型糟糕,工程再强也难有作为。
但泄露的代码确实为开发者提供了极佳的案例。比如一些开发者在某一些领域里面有独特的领域Knowhow和数据,但在如何在工程层面实现低成本的内存机制、上下文管理、编排逻辑及安全机制上缺乏经验,这对缺乏相关积淀的公司极具参考价值。
岑峰: 很多人担心开源 Agent 最终会沦为闭源大厂的“免费测试员”。佳钇,未来是否可能出现一个绕开大厂“生态税”的去中心化应用网络?
张佳钇: 逻辑上,模型厂商确实有能力通过数据优势“吞掉”新出现的能力。去中心化的 Agent 网络一定会出现,但可能无法完全绕开 OpenAI 或 Anthropic。因为追求极致能力的用户永远无法避开最顶尖的闭源模型。
我认为创业者的思路需要转变:不要指望干掉巨头,而要为 Agent 打造基础设施(Infra)。 与其在更通用的 Computer Use 领域硬碰硬,不如去为 Agent 创造更快速、更原生的 CLI 工具和底层组件。通用 Computer Use 虽然范围广,但效率较低,为 Agent 定制的基础设施才是当下的蓝海。
岑峰: 当大厂开始提供工业级 Agent 服务时,创业者的价值是否会从功能提供转向行业 Know-how 的沉淀?常楠老师,你会如何选择方向?
常楠: 行业深度和强化学习(RL)算法能力缺一不可。像佳钇说我有独特的数据,然后知道怎么构建这个系统,这样可以在行业里有一个独特认知的Finetune的模型,可能会有一定的壁垒。但必须警惕,如果某个垂直行业的商业价值足够大,大厂很快就会带着资源蚕食该市场。
作为效率工具或问题解决类企业,与客户的核心关联在于长期信任积累。唯有承接大企业不愿做的 “脏活累活”,才能建立专属信任,促使客户开放独特的上下文、数据与工作流,进而构建专属智能体系统,以更低成本实现高效落地,形成差异化优势。
但这一模式面临双重挤压:一方面,Claude Code 等编码能力的崛起,使得客户企业可能自主搭建系统,形成内部替代;另一方面,上游模型厂商会向下拓展,下游客户企业会向上自建,创业公司的生存空间被大幅压缩。
若单纯做通用型 Agent 企业,无论是 ToB 还是 ToC,挑战都极大。ToB 领域易受上下游夹击,ToC 领域用户尝试意愿低,且模型厂商必然觊觎大众市场。唯有在特定垂直领域,构建通过 AI 生成的独特内容能力,形成核心壁垒,才有可能挖掘商业机会。
岑峰:有观众提问,能否具体介绍一下哪些场景是大厂没有关注的应用场景?
常楠:那些大的场景可能大厂都在关注,例如Sora类大场景、模型竞争及核心ToB领域,但像一些足AI娱乐、数字生命、Agent工作平台等赛道,大厂短期不会踏足。因为他们还在纠结模型的战争和一些非常大的ToB领域,对ToC的场景现在覆盖的还相对较少。
这类偏内容向的ToC场景,需人独特的审美品味,而AI目前尚未达到内容基础门槛,且模型厂商重工程、轻内容的文化,也让其暂未布局。因此,若能凭借独特品味做此类广普ToC应用,仍有一定的市场机会。
岑峰: 前段时间 OpenAI 关闭了 Sora 的某些预览服务,这是否反映了某种信号?
常楠: 巨头的算力是有限的,Sora 的降温反映了 OpenAI 在面对 Anthropic 等激烈竞争时需要收缩资源、聚焦核心战略。此外,AI 生成内容的留存率低,是因为低质内容已严重过剩。创业者应利用比 AI 更独特的 Taste 和对用户需求的精准理解,去连接产品与人。
岑峰: 过去的一小时里,我们见证了 Agent 竞争正从“模型智力”转向“系统工程能力”。总结一下今天的讨论:Agent正在从"模型智力"的竞争,转向"系统工程能力"的竞争。无论是VLM还是CLI路线,无论是开源还是闭源,最终都要回到一个核心问题:你能为用户创造什么价值?在这个"深水区"里,客户关系、行业Know-how、持续交付能力,才是创业者的真正壁垒。感谢两位嘉宾的深度分享。
Youtube链接:https://youtu.be/QGnynf82TRA?si=rE01vEtpxqQ8_0sp


从实验室Demo到国民级健康伙伴:医疗Agent离“进指南”还有多远?| GAIR Live 024

具身导航,感知推理到底是「上帝」,还是执行控制是「命门」?| GAIR Live 023

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
