5个月MaaS收入增长15倍,阿里云找到了做大Token生意的办法

Token之战要追求数量,更要追求质量。 |
文|邓咏仪
编辑|张雨忻
“阿里云MaaS业务的Token收入,在2026年的过去5个月里增长了15倍,月度Token收入已经达到数亿元级别。”这是阿里云在5月20日的发布会上给出的最新数字。而拉动这笔收入的最直接原因指向了一个词:Agent。
这一天,阿里云发布了新一代旗舰模型Qwen 3.7 Max等一系列产品,这距离Qwen 3.6 Max的面世仅仅过去了一个月。
为什么这么着急?随着今年2月OpenClaw的爆火,各家模型厂商都开始针对Agent做模型在Coding能力上的提升。大模型的Coding能力之争越来越白热化,阿里也必须端出一款在Coding方面能打的模型,保持自身MaaS业务的竞争力。“未来是Agent Cloud的时代。”阿里云公共云总裁刘伟光表示。
无独有偶,大洋彼岸的硅谷,Google I/O大会也在同一天举办,主题同样是Agent Cloud,Google新发布的芯片、模型、应用……几乎所有产品也都围绕Agent展开。
Agent Coding,已经成为全球现阶段的AI共识。

狠狠做Agent
发布会第一个端上来的新“千问云”官网,这是一个为Agent设计的网页,也是阿里云成立17年以来,第一次为单独业务做的独立官网。

“千问云是为Agent设计的,而不是人类。”阿里云公共云事业部负责人刘伟光说,这来自2024年底,阿里云内部的一个判断:未来云计算产品的主要使用对象,也会逐渐从人类工程师变成Agent。
在过往,一个开发者或企业想要在云上部署服务,需要打开官网,注册之后,然后面对上百个产品分类,自己选机型、配网络、开实例、装环境、调API——每一步都需要人类工程师做判断,上手门槛不低。
但在千问云官网上线背后,动线会发生变化:Agent会先找模型,再找工具和skills,最后才是底层云资源。顺序反过来了。
一个例子是,在龙虾上线后,阿里云发现Agent可以在一天之内自动完成云计算资源的开通,这在过去,是人类要干两周的活。“未来不需要人来开通了,Agent自动就在后台把云计算资源激活了。”刘伟光说。
官网只是前菜。阿里云从上层的模型到Infra到底层的芯片,都围绕Agent重新完成了一次适配。
首先是新一代旗舰模型Qwen 3.7 Max的推出,这距离Qwen 3.6 Max的发布仅一个月时间。
尽管一直以来阿里在开源领域建立了不错的影响力和口碑,但相较国内的智谱GLM、Kimi,阿里的旗舰模型并没有享受到小龙虾带来的最大红利。
而Qwen 3.7 Max的发布,则阿里在Coding领域试图扳回一城的动作。
在目前业界最权威的代码能力测试中,Qwen 3.7 Max已经追平了DeepSeek的最强版本,在难度更高的复杂工程任务测试中,Qwen 3.7 Max也排到了第一的位置。

△Qwen3.7-Max可独立执行长达35小时的长程复杂任务,工具调用数量也在各大模型中位于前列,图源:阿里云
相较上一代Qwen 3.6 Max Preview,Qwen 3.7 Max最大的升级是长周期任务能力的大幅强化——Agent可以自主执行跨越数十小时、上千步骤的复杂任务,而不需要人类中途介入。
长程任务能力越强,意味着Agent能够独立完成的任务复杂度越高、人类介入越少。这也是Claude Code、Gemini Deep Research等当下最强Agent产品的核心竞争维度。
阿里云CTO周靖人举的一个例子是:在平头哥的新芯片平台上,Qwen3.7-Max通过自主编程和超1000次工具调用,实现了平台关键内核的自我进化,推理速度较原版本提升10倍。
这意味着,模型能够像成熟的工程师一样,独立解决代码中间缺陷的问题,也可以帮助工程师开发复杂的功能。
而这些任务能够完成,也离不开芯片和Infra的适配:在芯片层,阿里云的新一代训推一体AI芯片真武M890,以及自研互联芯片ICN Switch 1.0,都搭载在超节点服务器上,主打的就是Agent的大规模并发场景。
而现在,阿里平头哥PPU芯片出货已经超过54万片,并且在悟空、秒悟等AI应用中已经开始提供推理服务。
怎么把Token生意越做越大
Agent爆发带来了Token消耗的爆发——Agent本质是代码生成,一次任务调用的Token量,是普通对话场景的十倍甚至百倍。
所以,Agent共识也直接演变成了模型市场的一场明牌战争:谁的模型在Agent场景下被调用得多,谁就能够迅速获得收入——当今市场的最大赢家无疑就是Anthropic,据华尔街日报,Anthropic的营收预计将在第二季度增长一倍以上,达到109亿美元。

△图源:华尔街日报
阿里云也受益于此。2025年,阿里云自然年全年营收超1466亿元,当年营收增速28.6%,后者主要得益于AI产品的贡献。
阿里巴巴CEO吴泳铭在上周的财报电话会上透露,6月份季度,包含百炼MaaS平台在内的AI模型与应用服务年化经常性收入(ARR)将突破100亿元,年底突破300亿元。
不过,在这场Token战争中,阿里和字节选择了两种不一样的打法。
“Token带来的收入主要来自两端,一端是以Coding为代表的大语言模型,另一端是视频模型。但在过去一段时间,很多人会把两个市场的Token增量混为一谈,这是不合适的。”刘伟光强调。
字节占住了视频模型市场——有研究机构测算,Seedance 2.0爆火后,字节在视频模型市场的Token日均消耗已占整个市场的80%。2025年底火山曾立下目标——2026年MaaS服务收入超过100亿,但在Seedance 2.0爆火之后,这个目标已经再度上调。
相较之下,阿里云则在大语言模型上占据优势。“有开发者的公司,才会需要云,所以阿里云的存量客户(肯定有开发者)几乎都是Coding的潜在用户。”刘伟光说。
2025年底,阿里云曾喊出“2026拿下AI云市场增量的80%”的业务目标。阿里云将当下的业务火力,集中在了Coding领域。“今年前5个月,我们可以说,阿里云已经拿到了LLM模型市场增量的80%。”
为了配合这一目标,阿里云对销售的考核方式也在变——不是看谁卖出去的Token量最大,而是比谁卖出去的Token最值钱。
简单来说,阿里云现在追求的,并不是简单聊天产生的Token消耗,因为这类模型的价格已经到了地板价。
相反,阿里云如今的一个核心指标是:模型接入客户的核心业务系统数量。这意味着,阿里云希望卖出去的Token,是被客户用来写代码、做决策、跑流程。而一旦进入企业的核心生产流程,Token消耗量是指数级上升的,单价更高,复购更稳定,对应的也是更高质量的收入。
这源于Coding的Token消耗逻辑和视频并不一样。视频模型的Token消耗是一次性的——生成一段视频,任务结束。
代码场景则更像一个自我进化的过程:模型写出代码,代码变成应用,应用部署到云上,应用运行起来后又需要调用模型,模型再生成更多代码。
如今的大模型竞赛,已经完全是一种系统工程的较量——芯片、Infra与大模型的耦合,已经成为影响模型训练、提供推理服务系效率的最重要因素;商业竞争也在加速,则是迅速验证场景价值,为模型反哺智能。
“芯片、模型和云,现在三者就像是齿轮要和在一起、螺旋上升的过程。”刘伟光表示,如果未来拼的是每一块芯片都能跑出比竞争对手更多的Token、更高质量的Token,“那我们就胜利了。”
以下为刘伟光关于阿里云、Agent趋势Token之战的更多分享,经《智能涌现》编辑整理:
1、云计算的天花板因为Agent再度被打开了
云计算时代,我们的商业模式相对简单,但有一个长期痛点:盘点客户IT预算时,企业内部的软件开发和人力外包这块,我们是吃不到的。现在正好反过来,这些预算恰恰是AI Coding能100%命中的。
我们看到,互联网企业的Token支出已经达到IT支出的15%~20%,传统企业还在5%以下,空间还很大。阿里云今年的目标,是在每一个客户的收入中,Token收入占比不低于20%。
以汽车行业为例,过去我们能做的就是ERP上云,后来是智驾算力,再后来是大模型对话,现在连广告营销都能做了。原来汽车行业最大IT投入在ERP,现在变成AI。
金融领域也一样,以前做券商客户,我们很难跟客户谈业务,那是专业领域。现在是客户主动找我们,因为头部投研、量化、私募的业务场景,都必须跟大模型深度结合。
Agent已经成为带动模型市场、甚至带动存量云市场的最大推动力。所以Token和云这两件事,在阿里云这里是天然绑定的。这也是为什么Coding是我们最重要的方向,它几乎for everything。
2、Agent天然是云业务的增长飞轮
Token和GPU是有换算比例的。我们从实际数据发现,Agent爆发后,一张GPU卡的消费基本上带动了一张CPU卡的消费,假如100块钱的GPU推理消耗,会同时产生200块钱的GPU+CPU云资源消耗——因为Agent生成的应用要部署、要运行、要弹性扩容。
这意味,厂商没有强大的CPU云,就没法服务这些Agent。这就是为什么我们一直在说Agent Cloud这个概念,这中间是存在真实的收入闭环的。
3、阿里云的销售体系需要迅速变革
我们现在单独给大客户配纯MaaS销售,和原来卖IaaS的销售打配合。哪怕一个客户身上出现两三个销售重叠,这个代价也可以接受,最重要的是不能让机会错失。
坦白讲,在云这个产业经营太久,每个人都有思维惯性。过去做云,版图是很清晰的——客户线下多少台服务器,搬上来要花多少钱,答案不会差太大。但做MaaS,你进去之后可能发现答案远超想象。而且MaaS需要跟业务部门、跟CEO打交道,不是跟IT人员打交道,这本身就是挑战。
有意思的是,越传统的企业越容易拥抱AI,因为AI让他们一些工作变简单了。现在,做畜牧的企业,都在大规模拥抱AI,这在过去是不可想象的。
4、Token之战要追求数量,更要追求质量
调用量可以靠对话堆出来,但我们不看这个,我们看三个指标:付费Token客户数是不是每天在增长;每个客户是不是在核心系统接入模型、解决刚需;Agent自主完成任务闭环的效率。美国那边的共识也一样——用最少Token完成最有效任务,而不是用更多Token完成更多任务。
正因为追求高质量Token,MaaS从第一天起就应该是有利润的生意。现在,我们的百炼平台(Infra)和模型团队本身就在一起,每天做推理框架的极致优化。
中国目前还是按量为主,但我们的终极目标一定是希望让客户为结果付费。
封面来源|AI生成








