深度｜MaaS竞争下半场，谁能掌握智能的定价权

发布时间：2026-03-31来源：Z Potentials

导语｜价格战还在继续，但行业已经开始分层

过去一年，国内基础模型行业最强的一条共识，是价格会持续下探。模型能力在追赶，开源在缩小差距，推理成本在下降，降价和免费成了最直观的竞争动作。顺着这套逻辑往下推，基础模型更像一种供给不断增加的通用能力。供给越多，价格越低，壁垒越薄，最后很容易滑向同一种判断，基座模型很难真正拥有定价权。

但今天，这套判断已经不够解释现实。智谱上市后首份财报给出的，不只是增长数字，而是一组更关键的信号。MaaS API 平台 ARR 超过17亿元人民币，过去一年提升60倍，平台毛利率提升近5倍至18.9%，全年综合毛利率达到41%，全年收入超过7.24亿元，同比增长131.9%。一季度 API 涨价 83% 后，调用量未落反增。MaaS API 平台覆盖400万企业用户及开发者，服务全球超过218个国家，中国前十大互联网公司中有 9 家在使用 GLM 模型。

把这些信号放在一起看，国内 MaaS 的竞争已经不再只是低价换调用，而是在进入分层阶段。

01 同样是模型公司，卖的已经不是同一种东西

今天的基础模型公司，表面上都在卖模型，实质上卖的东西已经不同。

第一类卖的是通用能力，核心是便宜、快、覆盖广。这类平台更像智能时代的公用水电。Google 的 Gemini Flash 与 Flash Lite 被官方直接定义为快速、低成本、多模态模型，其 API 定价显示，付费档的输入和输出价格都极具竞争力；OpenAI 也把 GPT 体系里的 nano 或 mini 型号明确定位为高频、简单任务的低成本模型；阿里云则在 Qwen 的官方定价页里把 Qwen Flash 写成更具成本效率的调用层。这个市场里，价格就是最有效的武器。

第二类卖的则不再只是模型输出，而是任务完成率，是进入正式工作流后的可交付性。Anthropic 的 Claude Team 与 Enterprise 页面已经很直白地展示了这一路径，它卖的不只是模型，而是一整套组织级能力，包括 Claude Code、企业搜索、连接器、审计日志、权限控制和合规能力。Anthropic 还在其成本文档里披露，在团队使用场景下，平均每位开发者的月度成本在一个可控的范围内，且绝大多数用户的日成本都维持在较低水平。这说明客户付费购买的，不再只是一次回答，而是持续工作的工程能力。

顺着这个框架回看智谱，财报里真正有价值的，也不是收入规模本身，而是收入结构的变化。MaaS API 平台 ARR 抬升，平台毛利率与全年综合毛利率同步改善，说明收入来源正在从项目制和私有化交付，向标准化 API 服务切换。更关键的是，GLM-5 发布 24 小时内，就获得字节 TRAE、扣子 Coze、阿里 Qoder、腾讯 CodeBuddy、美团 CatPaw、百度智能云与 WPS Office 等头部平台接入。收入一旦从项目推进转向持续调用，会变得更接近可累积的智能服务收入。

02 定价权不是喊出来的，是由智能质量决定的

过去市场普遍认为，基础模型没有定价权。这个判断并非没有依据。早期很多模型提供的是相对容易替代的能力，用户比较的是参数、榜单和单次调用成本，只要体验没有明显拉开，谁便宜，谁就更容易拿量。供给充裕的市场，本来就很难长出溢价。

但智谱的实践给出了截然不同的答案。一季度 API 定价提升 83%，市场不仅没有收缩，反而呈现出供不应求的态势，调用量增长了 400%。这印证了一个核心判断：高质量的 Token 是当下的稀缺资源，谁掌握了智能的上界，谁就掌握了定价权。对于已经把模型深度接入工作流的企业来说，模型效果带来的收益，已经足以覆盖更高的 Token 成本。智谱希望强化的“中国 Anthropic”路径，本质也在这里。它不是简单的公司标签类比，而是一条被验证的商业路径，即以更高的模型智能上界，带动更深的企业与开发者使用，再通过 API 这种标准化形态，把智能能力持续卖进生产环境。

03 高质量 Token，开始对应更完整的智能劳动

这一轮定价权的形成，背后不是财务技巧，而是任务形态变了。前几年的主流场景，更多是问答、摘要、检索、单轮生成。今天更有价值的场景，越来越不是一句提示词就能解决的事。它们跨步骤、跨工具、跨上下文，有时还跨天、跨系统。模型要在这样的任务里创造价值，靠的已经不是会不会回答问题，而是能不能持续推进工作。

这条演进线，在 Coding 领域最清楚。早期的 AI Coding，是局部提效工具。随后出现的 Vibe Coding，把编程进一步推向大众表达。再往前走，Agentic Engineering 要求的已经是另一层能力，模型要理解需求、拆任务、调用工具、编写、测试、修复，再继续推进。智谱这轮技术叙事的关键，就在于 GLM 系列从 GLM-4.5、GLM-4.6、GLM-4.7 迭代到 GLM-5 与 GLM-5-Turbo，底层方向并不是单纯追求参数增长，而是从知识导向转向任务导向，从 Vibe Coding 的先行者走向 Agentic Engineering 的先行者。GLM-5 不再只是代码生成器，而是在朝真正的工程师演化。这里真正重要的，不是 agent 这个词本身，而是 long horizon task，也就是长周期任务。真实世界里最值钱的工作，大多属于这一类。模型一旦开始承接这类任务，Token 的意义就会发生变化。它不再只是算力消耗单位，更像智能劳动被切分后的计量方式。高质量 Token 消耗会迅速增长，也就不难理解了。

而高质量 Token的价值变现路径也十分清晰。智能的质量创造定价权，企业和用户的深度使用创造增长的Scaling。比如，2025年智谱在国内第一家推出编程套餐“GLM Coding Plan”，迅速覆盖全球，付费开发者规模快速突破24.2万，Token调用量6个月涨了15倍。

除了聚焦Coding以外，智谱也是国内Agent布局最早的模型厂商，从全球首个手机Agent AutoGLM到国内首个一键安装的AutoClaw。2026年3月，继Coding Plan之后我们推出Claw Plan，上线仅两天订阅用户即破10万，上线20天订阅用户突破40万，这验证了智能体长链路任务的巨大商业空间。

在全球维度，GLM模型已全面部署于Google Vertex AI、AWS Bedrock、Fireworks、Cerebras等全球顶尖云服务商，并入驻OpenRouter、Vercel等国际主流模型聚合平台，是OpenRouter付费模型排名NO.1。GLM已成为国际知名Coding平台（如Windsurf）、知名CodingAgent平台（如OpenCode）的默认模型。

至此，一条清晰的逻辑链条得以闭合：最强的模型效果，带来最高质量的 tokens，进而带动 MaaS API 业务的爆发。

04 市场真正重估的，是智能服务的商业结构

放到这个背景里，TAC 这个概念才有意义。TAC，也就是 Token Architect Capability，讨论的不是模型本身强不强，而是一个组织调度智能、吸收智能、再把智能转化为经济成果的能力有多强。对智谱来说，TAC 不只是一个概念补充，更是未来增长故事。今天财报证明的是，模型智能能够通过 API 服务被卖进企业和开发者的真实工作流；明天它要讲的是，随着组织越来越依赖 AI 去承接任务、安排流程和创造经济成果，决定竞争力的将不只是拥有模型，而是拥有更高的 Token 架构力。智谱想卡位的，正是这个过程中最底层的能力供给者。

这也是资本市场的估值语言正在变化的原因。过去更容易被追逐的是参数规模、榜单位置、发布节奏和融资速度。今天更值得看的，变成了另一组问题。谁的模型已经进入真实生产环境，谁的调用具备持续性，谁的客户更看重价值优先，谁开始拥有围绕任务完成率形成的溢价空间。价格战当然不会立刻结束，但只用价格理解这个行业，已经开始失真。把智谱这份财报放在这里看，意义也就更清楚了。国内 MaaS 的竞争，正在从谁先把调用量做大，逐步走向谁能把智能卖出溢价。

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。