从芯片到入口，阿里云正在为Agent重做一切

发布时间：2026-05-20来源：硅星人Pro

作者｜Yoky
邮箱｜yokyliu@pingwest.com

Agent 时代需要一种什么样的云？

这个问题，过去两年行业一直在绕着走。大家都在说 Agent，都在说 AI Native，但落到产品上，大多数云厂商的做法是：在原来的控制台旁边加一个 AI 助手，在原来的 API 上面套一层模型调用接口。

换句话说，云还是那朵云，只是多了一个 AI 的壳。

这个做法有一个根本性的问题：它假设 Agent 的工作方式和人类工程师是一样的，登录控制台，选产品，配参数，调 API。但 Agent 根本不是这么工作的。

一个 Agent 接到任务之后，会自己拆解步骤、调用工具、反复推理、检查纠错，一个任务背后是几十上百次模型调用，任务周期从几秒延展到数十小时。它不需要一个给人看的控制台，它需要的是一套能被它直接调用的基础设施。

这是两种完全不同的设计哲学，不是加一个 AI 模块能解决的。

2026年5月20日，阿里云在年度云峰会上给出了它的回答：从底层芯片到云平台到模型到推理再到MaaS入口，四层同时动。

拒绝套壳的“AI云”，阿里云为Agent重写了一切。

阿里云把官网换成了一行代码

阿里云的重构，从一个新官网开始。

千问云（www.qianwenai.com）是阿里云17年来首次在官网之外建立的独立产品官网。打开页面，不突出产品列表，也不突出控制台，首页最突出的是一行字。

安装 Skills npx skills add QianWen-AI/qianwen-ai

这是一条 Agent 可读的 prompt 指令。整个官网，就是一个给 Agent 看的入口。

阿里云资深副总裁刘伟光解释了这个设计背后的逻辑变化："链路顺序变了：先找模型，再操作，再回到云。所以我们把入口改了顺序，优先从入口去找模型、工具、Skills、MCP。"

设计风格只是表象。背后是一个判断：云的主要用户正在从人变成 Agent。阿里云内部已经形成了明确共识：传统云计算产品的主要使用对象，将逐渐从人类工程师变成 Agent。

这个判断有具体的数据支撑。伴随着OpenClaw的爆火和Agent的普及，阿里云发现了一个过去从未出现过的现象：不需要人来开通云资源了，龙虾自动在后台把云计算激活了。

"一天之内完成的云计算资源开通，可能是过去人要干两周的活。Agent 在默默自动自己使用云了。"刘伟光说，这个现象出现之后，他们意识到，龙虾只是一个开始，未来会有越来越多这样的智能代理，云必须为它们准备好，进来之后不需要人干预，直接在后台开通。

千问云集成了 150 多个模型系列、480 多款模型，把平台能力封装为 Agent 可直接调用的标准化技能。千问云的另一个变化是客户结构：很多个人和专业人士、公司里的业务人员，都可以直接配一个 Coding Plan 或 Token Plan，第一次成为阿里云的客户。

在全球主流云厂商中，AWS Console、Azure Portal、Google Cloud Console 仍以传统形态存在，各家通过 Amazon Q、Copilot、Gemini 等 AI 助手作为辅助层嵌入。

阿里云是第一个把官网首页换成 Agent 可读指令的主流云厂商。上一次中国头部科技公司以如此决绝的方式重构产品入口，可能要追溯到移动互联网早期，当所有人把 PC 官网的流量让位给 App 的那个阶段。

只不过这一次更彻底：App 至少还需要人去打开，而 Agent 只需要"读"一条指令。

芯片、模型、云，真正结合在一起

龙虾自动开通云资源，听起来像一个产品功能，但它背后有一个更深的问题：Agent 要能做到这件事，它调用的每一层基础设施都得是真正为它设计的。

模型要能理解任务、拆解步骤；云产品要能被 Agent 直接识别和调用，而不是等着人去点控制台；底层的算力要能撑住几十上百次模型调用同时发生。

这三件事，任何一层掉链子，Agent 就只能停在那里等人来接手。

阿里云这次峰会的核心，就是把这三层围绕Agentic时代全面升级。

芯片是一切的起点。平头哥这次发布了新一代训推一体 AI 芯片真武 M890，144GB 显存，片间互联带宽 800GB/s，性能是上一代的 3 倍，以及自研互联芯片 ICN Switch 1.0，两者共同搭载于磐久 AL128 超节点服务器，128 张 AI 芯片组成一台计算机，P2P 时延低于 150ns，主打解决 Agent 场景下的海量并发推理和大模型训练需求。

目前真武系列累计出货 56 万片，服务 400 多家客户，包括中国电信、中国一汽、浦发银行。平头哥同时首次公布了芯片路线图，未来两年将陆续推出真武 V900、真武 J900 两代芯片。

加上此前已有的倚天 CPU、磐脉智能网卡、镇岳存储主控芯片，平头哥的芯片版图已经覆盖算力、网络、存储全链路。这在国内云厂商中是唯一一家，在全球也只有谷歌（TPU）、亚马逊（Trainium）、微软（Maia）做到了同等规模的自研商用。

芯片之上是云平台的重构。阿里云将 100 多条现有云产品进行 Skill 化、MCP 化、CLI 化改造，让 Agent 能像人类用户一样识别并调用云资源；同时为 Agent 构建了全新运行环境——轻量沙箱、多 Agent 协同、跨任务记忆、全域智能运维。

但算力和平台只是地基。Agent 能不能真正完成任务，最终取决于模型本身够不够强。

模型层，在三方机构Arena全球大模型盲测总榜中，Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，与GPT、Claude、Gemini最强模型接近，位列国产模型第一。

比排名更有说服力的是一个实战案例：在从未见过的真武 M890 芯片上，Qwen3.7-Max 仅凭一份任务说明，自主工作 35 小时，独立完成了一个生产级 AI 计算内核的编写与调优，性能较官方版本提升 10 倍。

没有人类干预，没有中间指导。这个案例背后的逻辑概括为一句话：大模型正在经历一次核心范式转移，从对齐人类偏好，到对齐任务目标。过去我们追求的是模型'说得好'，现在要求模型'做得到'。

近 3 个月内，千问旗舰模型已连续发布 3.5、3.6、3.7 三个版本，这种迭代节奏在全球旗舰模型中属于最快之列。

推理平台百炼是快速迭代的保障：SLA 稳定 4 个 9，冷启动降低 90% 以上，每分钟可拉起 10000 个 Pod，Prompt Caching 最高节省 90% 成本。

九家模型厂商入驻，开放接入 GLM-5.1、MiniMax M2.7、Kimi K2.6 等主流模型。现在百炼ARR 已突破 80 亿元，本季度破 100 亿是确定性事件，年底目标 300 亿。

全栈的价值不是技术荣誉，是成本结构

这套体系的核心价值，不在于每一层单独有多强，而在于它们是真正咬合在一起的。

刘伟光的一句话揭示了这种改变的本质："今天你给客户呈现的结果，是模型能力、芯片能力和云能力三件事的完整有机结合，真正的结合，不是用嘴说的结合。"

这句话的含义是：全栈自研的价值，不是技术荣誉，是成本结构。自研芯片省掉了向海外厂商支付的高额利润，直接转化为推理服务的价格竞争力；模型与芯片的深度协同，让同一台服务器跑出更多高质量 Token；百炼平台从第一天定价起就有利润。

刘伟光透露，"MaaS 已经有利润了，一直有利润，从第一天定价开始"，因为工程团队和模型团队本来就是一个团队，每天在做的事就是把推理框架调到极致。

这也是为什么阿里云敢于在入口层做出最激进的切换。千问云那一行代码背后，是一套从芯片到模型到平台都已经打通的基础设施。如果底层任何一层是外采的，这种切换就是空话。

从商业结构来看，这次全栈升级正在改变阿里云的利润来源。MaaS 收入的毛利率高于传统 IaaS，同一台服务器交给百炼平台，创造的营收和毛利高于传统算力服务，卖面包比卖面粉有更大的空间。

随着 MaaS 收入占比提升和自研芯片渗透率扩大，阿里云正在从"卖资源"转向"卖智能"。刘伟光给出了一个分层判断：AI 原生创业企业的 Token 支出占 IT 支出接近 100%；国内互联网企业目前在 15%-20%；传统企业还在 5% 以下。传统企业的这个数字，是最大的增量空间所在。

Agent 时代的云计算竞争，不再是单一产品的比拼，而是全栈体系的竞争，任何一层的短板都会成为瓶颈。谷歌、亚马逊、微软的 Agent 化改造，更多是在现有平台上叠加能力；阿里云的做法是重写底座。

在 LLM 市场，阿里云目前是规模第一，也是中国市场，目前唯一一家能在芯片、云平台、模型、推理平台、入口五层同时发力的云厂商。

点个“爱心”，再走吧

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。