深度|MaaS竞争下半场,谁能掌握智能的定价权


导语|价格战还在继续,但行业已经开始分层
过去一年,国内基础模型行业最强的一条共识,是价格会持续下探。模型能力在追赶,开源在缩小差距,推理成本在下降,降价和免费成了最直观的竞争动作。顺着这套逻辑往下推,基础模型更像一种供给不断增加的通用能力。供给越多,价格越低,壁垒越薄,最后很容易滑向同一种判断,基座模型很难真正拥有定价权。
但今天,这套判断已经不够解释现实。智谱上市后首份财报给出的,不只是增长数字,而是一组更关键的信号。MaaS API 平台 ARR 超过17亿元人民币,过去一年提升60倍,平台毛利率提升近5倍至18.9%,全年综合毛利率达到41%,全年收入超过7.24亿元,同比增长131.9%。一季度 API 涨价 83% 后,调用量未落反增。MaaS API 平台覆盖400万企业用户及开发者,服务全球超过218个国家,中国前十大互联网公司中有 9 家在使用 GLM 模型。

把这些信号放在一起看,国内 MaaS 的竞争已经不再只是低价换调用,而是在进入分层阶段。
01 同样是模型公司,卖的已经不是同一种东西
今天的基础模型公司,表面上都在卖模型,实质上卖的东西已经不同。
第一类卖的是通用能力,核心是便宜、快、覆盖广。这类平台更像智能时代的公用水电。Google 的 Gemini Flash 与 Flash Lite 被官方直接定义为快速、低成本、多模态模型,其 API 定价显示,付费档的输入和输出价格都极具竞争力;OpenAI 也把 GPT 体系里的 nano 或 mini 型号明确定位为高频、简单任务的低成本模型;阿里云则在 Qwen 的官方定价页里把 Qwen Flash 写成更具成本效率的调用层。这个市场里,价格就是最有效的武器。
第二类卖的则不再只是模型输出,而是任务完成率,是进入正式工作流后的可交付性。Anthropic 的 Claude Team 与 Enterprise 页面已经很直白地展示了这一路径,它卖的不只是模型,而是一整套组织级能力,包括 Claude Code、企业搜索、连接器、审计日志、权限控制和合规能力。Anthropic 还在其成本文档里披露,在团队使用场景下,平均每位开发者的月度成本在一个可控的范围内,且绝大多数用户的日成本都维持在较低水平。这说明客户付费购买的,不再只是一次回答,而是持续工作的工程能力。
顺着这个框架回看智谱,财报里真正有价值的,也不是收入规模本身,而是收入结构的变化。MaaS API 平台 ARR 抬升,平台毛利率与全年综合毛利率同步改善,说明收入来源正在从项目制和私有化交付,向标准化 API 服务切换。更关键的是,GLM-5 发布 24 小时内,就获得字节 TRAE、扣子 Coze、阿里 Qoder、腾讯 CodeBuddy、美团 CatPaw、百度智能云与 WPS Office 等头部平台接入。收入一旦从项目推进转向持续调用,会变得更接近可累积的智能服务收入。
02 定价权不是喊出来的,是由智能质量决定的
过去市场普遍认为,基础模型没有定价权。这个判断并非没有依据。早期很多模型提供的是相对容易替代的能力,用户比较的是参数、榜单和单次调用成本,只要体验没有明显拉开,谁便宜,谁就更容易拿量。供给充裕的市场,本来就很难长出溢价。
但智谱的实践给出了截然不同的答案。一季度 API 定价提升 83%,市场不仅没有收缩,反而呈现出供不应求的态势,调用量增长了 400%。这印证了一个核心判断:高质量的 Token 是当下的稀缺资源,谁掌握了智能的上界,谁就掌握了定价权。对于已经把模型深度接入工作流的企业来说,模型效果带来的收益,已经足以覆盖更高的 Token 成本。智谱希望强化的“中国 Anthropic”路径,本质也在这里。它不是简单的公司标签类比,而是一条被验证的商业路径,即以更高的模型智能上界,带动更深的企业与开发者使用,再通过 API 这种标准化形态,把智能能力持续卖进生产环境。
03 高质量 Token,开始对应更完整的智能劳动
这一轮定价权的形成,背后不是财务技巧,而是任务形态变了。前几年的主流场景,更多是问答、摘要、检索、单轮生成。今天更有价值的场景,越来越不是一句提示词就能解决的事。它们跨步骤、跨工具、跨上下文,有时还跨天、跨系统。模型要在这样的任务里创造价值,靠的已经不是会不会回答问题,而是能不能持续推进工作。
这条演进线,在 Coding 领域最清楚。早期的 AI Coding,是局部提效工具。随后出现的 Vibe Coding,把编程进一步推向大众表达。再往前走,Agentic Engineering 要求的已经是另一层能力,模型要理解需求、拆任务、调用工具、编写、测试、修复,再继续推进。智谱这轮技术叙事的关键,就在于 GLM 系列从 GLM-4.5、GLM-4.6、GLM-4.7 迭代到 GLM-5 与 GLM-5-Turbo,底层方向并不是单纯追求参数增长,而是从知识导向转向任务导向,从 Vibe Coding 的先行者走向 Agentic Engineering 的先行者。GLM-5 不再只是代码生成器,而是在朝真正的工程师演化。这里真正重要的,不是 agent 这个词本身,而是 long horizon task,也就是长周期任务。真实世界里最值钱的工作,大多属于这一类。模型一旦开始承接这类任务,Token 的意义就会发生变化。它不再只是算力消耗单位,更像智能劳动被切分后的计量方式。高质量 Token 消耗会迅速增长,也就不难理解了。
而高质量 Token的价值变现路径也十分清晰。 智能的质量创造定价权,企业和用户的深度使用创造增长的Scaling。比如,2025年智谱在国内第一家推出编程套餐“GLM Coding Plan”,迅速覆盖全球,付费开发者规模快速突破24.2万,Token调用量6个月涨了15倍。
除了聚焦Coding以外,智谱也是国内Agent布局最早的模型厂商,从全球首个手机Agent AutoGLM到国内首个一键安装的AutoClaw。2026年3月,继Coding Plan之后我们推出Claw Plan,上线仅两天订阅用户即破10万,上线20天订阅用户突破40万,这验证了智能体长链路任务的巨大商业空间。
在全球维度,GLM模型已全面部署于Google Vertex AI、AWS Bedrock、Fireworks、Cerebras等全球顶尖云服务商,并入驻OpenRouter、Vercel等国际主流模型聚合平台,是OpenRouter付费模型排名NO.1。GLM已成为国际知名Coding平台(如Windsurf)、知名CodingAgent平台(如OpenCode)的默认模型。
至此,一条清晰的逻辑链条得以闭合:最强的模型效果,带来最高质量的 tokens,进而带动 MaaS API 业务的爆发。
04 市场真正重估的,是智能服务的商业结构
放到这个背景里,TAC 这个概念才有意义。TAC,也就是 Token Architect Capability,讨论的不是模型本身强不强,而是一个组织调度智能、吸收智能、再把智能转化为经济成果的能力有多强。对智谱来说,TAC 不只是一个概念补充,更是未来增长故事。今天财报证明的是,模型智能能够通过 API 服务被卖进企业和开发者的真实工作流;明天它要讲的是,随着组织越来越依赖 AI 去承接任务、安排流程和创造经济成果,决定竞争力的将不只是拥有模型,而是拥有更高的 Token 架构力。智谱想卡位的,正是这个过程中最底层的能力供给者。
这也是资本市场的估值语言正在变化的原因。过去更容易被追逐的是参数规模、榜单位置、发布节奏和融资速度。今天更值得看的,变成了另一组问题。谁的模型已经进入真实生产环境,谁的调用具备持续性,谁的客户更看重价值优先,谁开始拥有围绕任务完成率形成的溢价空间。价格战当然不会立刻结束,但只用价格理解这个行业,已经开始失真。把智谱这份财报放在这里看,意义也就更清楚了。国内 MaaS 的竞争,正在从谁先把调用量做大,逐步走向谁能把智能卖出溢价。






