5个月MaaS收入增长15倍，阿里云找到了做大Token生意的办法

发布时间：2026-05-21来源：智能涌现

Token之战要追求数量，更要追求质量。

文｜邓咏仪

编辑｜张雨忻

“阿里云MaaS业务的Token收入，在2026年的过去5个月里增长了15倍，月度Token收入已经达到数亿元级别。”这是阿里云在5月20日的发布会上给出的最新数字。而拉动这笔收入的最直接原因指向了一个词：Agent。

这一天，阿里云发布了新一代旗舰模型Qwen 3.7 Max等一系列产品，这距离Qwen 3.6 Max的面世仅仅过去了一个月。

为什么这么着急？随着今年2月OpenClaw的爆火，各家模型厂商都开始针对Agent做模型在Coding能力上的提升。大模型的Coding能力之争越来越白热化，阿里也必须端出一款在Coding方面能打的模型，保持自身MaaS业务的竞争力。“未来是Agent Cloud的时代。”阿里云公共云总裁刘伟光表示。

无独有偶，大洋彼岸的硅谷，Google I/O大会也在同一天举办，主题同样是Agent Cloud，Google新发布的芯片、模型、应用……几乎所有产品也都围绕Agent展开。

Agent Coding，已经成为全球现阶段的AI共识。

狠狠做Agent

发布会第一个端上来的新“千问云”官网，这是一个为Agent设计的网页，也是阿里云成立17年以来，第一次为单独业务做的独立官网。

“千问云是为Agent设计的，而不是人类。”阿里云公共云事业部负责人刘伟光说，这来自2024年底，阿里云内部的一个判断：未来云计算产品的主要使用对象，也会逐渐从人类工程师变成Agent。

在过往，一个开发者或企业想要在云上部署服务，需要打开官网，注册之后，然后面对上百个产品分类，自己选机型、配网络、开实例、装环境、调API——每一步都需要人类工程师做判断，上手门槛不低。

但在千问云官网上线背后，动线会发生变化：Agent会先找模型，再找工具和skills，最后才是底层云资源。顺序反过来了。

一个例子是，在龙虾上线后，阿里云发现Agent可以在一天之内自动完成云计算资源的开通，这在过去，是人类要干两周的活。“未来不需要人来开通了，Agent自动就在后台把云计算资源激活了。”刘伟光说。

官网只是前菜。阿里云从上层的模型到Infra到底层的芯片，都围绕Agent重新完成了一次适配。

首先是新一代旗舰模型Qwen 3.7 Max的推出，这距离Qwen 3.6 Max的发布仅一个月时间。

尽管一直以来阿里在开源领域建立了不错的影响力和口碑，但相较国内的智谱GLM、Kimi，阿里的旗舰模型并没有享受到小龙虾带来的最大红利。

而Qwen 3.7 Max的发布，则阿里在Coding领域试图扳回一城的动作。

在目前业界最权威的代码能力测试中，Qwen 3.7 Max已经追平了DeepSeek的最强版本，在难度更高的复杂工程任务测试中，Qwen 3.7 Max也排到了第一的位置。

△Qwen3.7-Max可独立执行长达35小时的长程复杂任务，工具调用数量也在各大模型中位于前列，图源：阿里云

相较上一代Qwen 3.6 Max Preview，Qwen 3.7 Max最大的升级是长周期任务能力的大幅强化——Agent可以自主执行跨越数十小时、上千步骤的复杂任务，而不需要人类中途介入。

长程任务能力越强，意味着Agent能够独立完成的任务复杂度越高、人类介入越少。这也是Claude Code、Gemini Deep Research等当下最强Agent产品的核心竞争维度。

阿里云CTO周靖人举的一个例子是：在平头哥的新芯片平台上，Qwen3.7-Max通过自主编程和超1000次工具调用，实现了平台关键内核的自我进化，推理速度较原版本提升10倍。

这意味着，模型能够像成熟的工程师一样，独立解决代码中间缺陷的问题，也可以帮助工程师开发复杂的功能。

而这些任务能够完成，也离不开芯片和Infra的适配：在芯片层，阿里云的新一代训推一体AI芯片真武M890，以及自研互联芯片ICN Switch 1.0，都搭载在超节点服务器上，主打的就是Agent的大规模并发场景。

而现在，阿里平头哥PPU芯片出货已经超过54万片，并且在悟空、秒悟等AI应用中已经开始提供推理服务。

怎么把Token生意越做越大

Agent爆发带来了Token消耗的爆发——Agent本质是代码生成，一次任务调用的Token量，是普通对话场景的十倍甚至百倍。

所以，Agent共识也直接演变成了模型市场的一场明牌战争：谁的模型在Agent场景下被调用得多，谁就能够迅速获得收入——当今市场的最大赢家无疑就是Anthropic，据华尔街日报，Anthropic的营收预计将在第二季度增长一倍以上，达到109亿美元。

△图源：华尔街日报

阿里云也受益于此。2025年，阿里云自然年全年营收超1466亿元，当年营收增速28.6%，后者主要得益于AI产品的贡献。

阿里巴巴CEO吴泳铭在上周的财报电话会上透露，6月份季度，包含百炼MaaS平台在内的AI模型与应用服务年化经常性收入（ARR）将突破100亿元，年底突破300亿元。

不过，在这场Token战争中，阿里和字节选择了两种不一样的打法。

“Token带来的收入主要来自两端，一端是以Coding为代表的大语言模型，另一端是视频模型。但在过去一段时间，很多人会把两个市场的Token增量混为一谈，这是不合适的。”刘伟光强调。

字节占住了视频模型市场——有研究机构测算，Seedance 2.0爆火后，字节在视频模型市场的Token日均消耗已占整个市场的80%。2025年底火山曾立下目标——2026年MaaS服务收入超过100亿，但在Seedance 2.0爆火之后，这个目标已经再度上调。

相较之下，阿里云则在大语言模型上占据优势。“有开发者的公司，才会需要云，所以阿里云的存量客户（肯定有开发者）几乎都是Coding的潜在用户。”刘伟光说。

2025年底，阿里云曾喊出“2026拿下AI云市场增量的80%”的业务目标。阿里云将当下的业务火力，集中在了Coding领域。“今年前5个月，我们可以说，阿里云已经拿到了LLM模型市场增量的80%。”

为了配合这一目标，阿里云对销售的考核方式也在变——不是看谁卖出去的Token量最大，而是比谁卖出去的Token最值钱。

简单来说，阿里云现在追求的，并不是简单聊天产生的Token消耗，因为这类模型的价格已经到了地板价。

相反，阿里云如今的一个核心指标是：模型接入客户的核心业务系统数量。这意味着，阿里云希望卖出去的Token，是被客户用来写代码、做决策、跑流程。而一旦进入企业的核心生产流程，Token消耗量是指数级上升的，单价更高，复购更稳定，对应的也是更高质量的收入。

这源于Coding的Token消耗逻辑和视频并不一样。视频模型的Token消耗是一次性的——生成一段视频，任务结束。

代码场景则更像一个自我进化的过程：模型写出代码，代码变成应用，应用部署到云上，应用运行起来后又需要调用模型，模型再生成更多代码。

如今的大模型竞赛，已经完全是一种系统工程的较量——芯片、Infra与大模型的耦合，已经成为影响模型训练、提供推理服务系效率的最重要因素；商业竞争也在加速，则是迅速验证场景价值，为模型反哺智能。

“芯片、模型和云，现在三者就像是齿轮要和在一起、螺旋上升的过程。”刘伟光表示，如果未来拼的是每一块芯片都能跑出比竞争对手更多的Token、更高质量的Token，“那我们就胜利了。”

以下为刘伟光关于阿里云、Agent趋势Token之战的更多分享，经《智能涌现》编辑整理：

1、云计算的天花板因为Agent再度被打开了

云计算时代，我们的商业模式相对简单，但有一个长期痛点：盘点客户IT预算时，企业内部的软件开发和人力外包这块，我们是吃不到的。现在正好反过来，这些预算恰恰是AI Coding能100%命中的。

我们看到，互联网企业的Token支出已经达到IT支出的15%~20%，传统企业还在5%以下，空间还很大。阿里云今年的目标，是在每一个客户的收入中，Token收入占比不低于20%。

以汽车行业为例，过去我们能做的就是ERP上云，后来是智驾算力，再后来是大模型对话，现在连广告营销都能做了。原来汽车行业最大IT投入在ERP，现在变成AI。

金融领域也一样，以前做券商客户，我们很难跟客户谈业务，那是专业领域。现在是客户主动找我们，因为头部投研、量化、私募的业务场景，都必须跟大模型深度结合。

Agent已经成为带动模型市场、甚至带动存量云市场的最大推动力。所以Token和云这两件事，在阿里云这里是天然绑定的。这也是为什么Coding是我们最重要的方向，它几乎for everything。

2、Agent天然是云业务的增长飞轮

Token和GPU是有换算比例的。我们从实际数据发现，Agent爆发后，一张GPU卡的消费基本上带动了一张CPU卡的消费，假如100块钱的GPU推理消耗，会同时产生200块钱的GPU+CPU云资源消耗——因为Agent生成的应用要部署、要运行、要弹性扩容。

这意味，厂商没有强大的CPU云，就没法服务这些Agent。这就是为什么我们一直在说Agent Cloud这个概念，这中间是存在真实的收入闭环的。

3、阿里云的销售体系需要迅速变革

我们现在单独给大客户配纯MaaS销售，和原来卖IaaS的销售打配合。哪怕一个客户身上出现两三个销售重叠，这个代价也可以接受，最重要的是不能让机会错失。

坦白讲，在云这个产业经营太久，每个人都有思维惯性。过去做云，版图是很清晰的——客户线下多少台服务器，搬上来要花多少钱，答案不会差太大。但做MaaS，你进去之后可能发现答案远超想象。而且MaaS需要跟业务部门、跟CEO打交道，不是跟IT人员打交道，这本身就是挑战。

有意思的是，越传统的企业越容易拥抱AI，因为AI让他们一些工作变简单了。现在，做畜牧的企业，都在大规模拥抱AI，这在过去是不可想象的。

4、Token之战要追求数量，更要追求质量

调用量可以靠对话堆出来，但我们不看这个，我们看三个指标：付费Token客户数是不是每天在增长；每个客户是不是在核心系统接入模型、解决刚需；Agent自主完成任务闭环的效率。美国那边的共识也一样——用最少Token完成最有效任务，而不是用更多Token完成更多任务。

正因为追求高质量Token，MaaS从第一天起就应该是有利润的生意。现在，我们的百炼平台（Infra）和模型团队本身就在一起，每天做推理框架的极致优化。

中国目前还是按量为主，但我们的终极目标一定是希望让客户为结果付费。

封面来源｜AI生成

👇🏻 扫码加入「智涌AI交流群」👇🏻

《智能涌现》6氪旗下AI公众号

👇🏻 真诚推荐你关注 👇🏻

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。