从芯片到入口,阿里云正在为Agent重做一切

邮箱|yokyliu@pingwest.com
Agent 时代需要一种什么样的云?
这个问题,过去两年行业一直在绕着走。大家都在说 Agent,都在说 AI Native,但落到产品上,大多数云厂商的做法是:在原来的控制台旁边加一个 AI 助手,在原来的 API 上面套一层模型调用接口。
换句话说,云还是那朵云,只是多了一个 AI 的壳。
这个做法有一个根本性的问题:它假设 Agent 的工作方式和人类工程师是一样的,登录控制台,选产品,配参数,调 API。但 Agent 根本不是这么工作的。
一个 Agent 接到任务之后,会自己拆解步骤、调用工具、反复推理、检查纠错,一个任务背后是几十上百次模型调用,任务周期从几秒延展到数十小时。它不需要一个给人看的控制台,它需要的是一套能被它直接调用的基础设施。
这是两种完全不同的设计哲学,不是加一个 AI 模块能解决的。
2026年5月20日,阿里云在年度云峰会上给出了它的回答:从底层芯片到云平台到模型到推理再到MaaS入口,四层同时动。

拒绝套壳的“AI云”,阿里云为Agent重写了一切。
阿里云把官网换成了一行代码
阿里云的重构,从一个新官网开始。
千问云(www.qianwenai.com)是阿里云17年来首次在官网之外建立的独立产品官网。打开页面,不突出产品列表,也不突出控制台,首页最突出的是一行字。
安装 Skills npx skills add QianWen-AI/qianwen-ai

这是一条 Agent 可读的 prompt 指令。整个官网,就是一个给 Agent 看的入口。
阿里云资深副总裁刘伟光解释了这个设计背后的逻辑变化:"链路顺序变了:先找模型,再操作,再回到云。所以我们把入口改了顺序,优先从入口去找模型、工具、Skills、MCP。"
设计风格只是表象。背后是一个判断:云的主要用户正在从人变成 Agent。阿里云内部已经形成了明确共识:传统云计算产品的主要使用对象,将逐渐从人类工程师变成 Agent。
这个判断有具体的数据支撑。伴随着OpenClaw的爆火和Agent的普及,阿里云发现了一个过去从未出现过的现象:不需要人来开通云资源了,龙虾自动在后台把云计算激活了。
"一天之内完成的云计算资源开通,可能是过去人要干两周的活。Agent 在默默自动自己使用云了。"刘伟光说,这个现象出现之后,他们意识到,龙虾只是一个开始,未来会有越来越多这样的智能代理,云必须为它们准备好,进来之后不需要人干预,直接在后台开通。
千问云集成了 150 多个模型系列、480 多款模型,把平台能力封装为 Agent 可直接调用的标准化技能。千问云的另一个变化是客户结构:很多个人和专业人士、公司里的业务人员,都可以直接配一个 Coding Plan 或 Token Plan,第一次成为阿里云的客户。

在全球主流云厂商中,AWS Console、Azure Portal、Google Cloud Console 仍以传统形态存在,各家通过 Amazon Q、Copilot、Gemini 等 AI 助手作为辅助层嵌入。
阿里云是第一个把官网首页换成 Agent 可读指令的主流云厂商。上一次中国头部科技公司以如此决绝的方式重构产品入口,可能要追溯到移动互联网早期,当所有人把 PC 官网的流量让位给 App 的那个阶段。
只不过这一次更彻底:App 至少还需要人去打开,而 Agent 只需要"读"一条指令。
芯片、模型、云,真正结合在一起
龙虾自动开通云资源,听起来像一个产品功能,但它背后有一个更深的问题:Agent 要能做到这件事,它调用的每一层基础设施都得是真正为它设计的。
模型要能理解任务、拆解步骤;云产品要能被 Agent 直接识别和调用,而不是等着人去点控制台;底层的算力要能撑住几十上百次模型调用同时发生。
这三件事,任何一层掉链子,Agent 就只能停在那里等人来接手。
阿里云这次峰会的核心,就是把这三层围绕Agentic时代全面升级。
芯片是一切的起点。平头哥这次发布了新一代训推一体 AI 芯片真武 M890,144GB 显存,片间互联带宽 800GB/s,性能是上一代的 3 倍,以及自研互联芯片 ICN Switch 1.0,两者共同搭载于磐久 AL128 超节点服务器,128 张 AI 芯片组成一台计算机,P2P 时延低于 150ns,主打解决 Agent 场景下的海量并发推理和大模型训练需求。

目前真武系列累计出货 56 万片,服务 400 多家客户,包括中国电信、中国一汽、浦发银行。平头哥同时首次公布了芯片路线图,未来两年将陆续推出真武 V900、真武 J900 两代芯片。
加上此前已有的倚天 CPU、磐脉智能网卡、镇岳存储主控芯片,平头哥的芯片版图已经覆盖算力、网络、存储全链路。这在国内云厂商中是唯一一家,在全球也只有谷歌(TPU)、亚马逊(Trainium)、微软(Maia)做到了同等规模的自研商用。
芯片之上是云平台的重构。阿里云将 100 多条现有云产品进行 Skill 化、MCP 化、CLI 化改造,让 Agent 能像人类用户一样识别并调用云资源;同时为 Agent 构建了全新运行环境——轻量沙箱、多 Agent 协同、跨任务记忆、全域智能运维。
但算力和平台只是地基。Agent 能不能真正完成任务,最终取决于模型本身够不够强。
模型层,在三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一。

比排名更有说服力的是一个实战案例:在从未见过的真武 M890 芯片上,Qwen3.7-Max 仅凭一份任务说明,自主工作 35 小时,独立完成了一个生产级 AI 计算内核的编写与调优,性能较官方版本提升 10 倍。
没有人类干预,没有中间指导。这个案例背后的逻辑概括为一句话:大模型正在经历一次核心范式转移,从对齐人类偏好,到对齐任务目标。过去我们追求的是模型'说得好',现在要求模型'做得到'。
近 3 个月内,千问旗舰模型已连续发布 3.5、3.6、3.7 三个版本,这种迭代节奏在全球旗舰模型中属于最快之列。
推理平台百炼是快速迭代的保障:SLA 稳定 4 个 9,冷启动降低 90% 以上,每分钟可拉起 10000 个 Pod,Prompt Caching 最高节省 90% 成本。
九家模型厂商入驻,开放接入 GLM-5.1、MiniMax M2.7、Kimi K2.6 等主流模型。现在百炼ARR 已突破 80 亿元,本季度破 100 亿是确定性事件,年底目标 300 亿。
全栈的价值不是技术荣誉,是成本结构
这套体系的核心价值,不在于每一层单独有多强,而在于它们是真正咬合在一起的。
刘伟光的一句话揭示了这种改变的本质:"今天你给客户呈现的结果,是模型能力、芯片能力和云能力三件事的完整有机结合,真正的结合,不是用嘴说的结合。"
这句话的含义是:全栈自研的价值,不是技术荣誉,是成本结构。自研芯片省掉了向海外厂商支付的高额利润,直接转化为推理服务的价格竞争力;模型与芯片的深度协同,让同一台服务器跑出更多高质量 Token;百炼平台从第一天定价起就有利润。

刘伟光透露,"MaaS 已经有利润了,一直有利润,从第一天定价开始",因为工程团队和模型团队本来就是一个团队,每天在做的事就是把推理框架调到极致。
这也是为什么阿里云敢于在入口层做出最激进的切换。千问云那一行代码背后,是一套从芯片到模型到平台都已经打通的基础设施。如果底层任何一层是外采的,这种切换就是空话。
从商业结构来看,这次全栈升级正在改变阿里云的利润来源。MaaS 收入的毛利率高于传统 IaaS,同一台服务器交给百炼平台,创造的营收和毛利高于传统算力服务,卖面包比卖面粉有更大的空间。
随着 MaaS 收入占比提升和自研芯片渗透率扩大,阿里云正在从"卖资源"转向"卖智能"。刘伟光给出了一个分层判断:AI 原生创业企业的 Token 支出占 IT 支出接近 100%;国内互联网企业目前在 15%-20%;传统企业还在 5% 以下。传统企业的这个数字,是最大的增量空间所在。
Agent 时代的云计算竞争,不再是单一产品的比拼,而是全栈体系的竞争,任何一层的短板都会成为瓶颈。谷歌、亚马逊、微软的 Agent 化改造,更多是在现有平台上叠加能力;阿里云的做法是重写底座。
在 LLM 市场,阿里云目前是规模第一,也是中国市场,目前唯一一家能在芯片、云平台、模型、推理平台、入口五层同时发力的云厂商。





