用DAA衡量智能体百度智能云用“新全栈”重新定义AI云｜甲子光年

发布时间：2026-05-14来源：甲子光年

智能体规模化的产业进程，第一次有了属于自己的“电力系统”。

作者｜刘杨楠

编辑｜栗子

经济学家保罗·大卫曾设问：为什么电灯泡发明后，工厂生产率迟迟不提高？他的答案是，通用技术从出现到真正拉动经济，需要漫长的组织重构。

电力进入工厂40年后，生产线才围绕电动机彻底改造，红利集中释放。汽车工业的真正爆发，靠的是精密加工、标准化模组等整个供应链的成熟；苹果重新定义智能手机，也不靠单项技术，而是硬件、软件和应用生态的系统性整合。

可见，每当技术应用复杂度越过临界点，就会倒逼底层供给方式的重构，从而真正引爆其产业价值。今天，AI正站在一个相似的位置上。

2026年，产业的焦点已从“模型强不强”转向“智能体能不能落地”。Chatbot的任务链路是线性的，“提问-回答”即为一次调用完成；智能体则需要执行长程、多步的任务，涵盖路径规划、调用工具、处理反馈、修正错误等多个环节，上下文窗口随轮次急剧膨胀，计算负载高度动态。

但一味考虑Token消耗，只关注成本转化，似乎并非唯一的解题思路。5月13日，在Create 2026百度AI开发者大会上，李彦宏提出了新概念——DAA（日活智能体数），他认为Token不一定代表终局，它只代表成本并不代表收益，衡量的是投入而非产出，DAA则大致对应移动互联网时代通用的度量衡日活用户数（DAU），未来“衡量一个平台和生态的繁荣，更应该看的是DAA这个指标，关注有多少Agent在给人类干活，并交付结果。”李彦宏还预测，未来全球日活智能体数（DAA）可能超过100亿。

这是基于大规模智能体应用时代与Token消耗之间的另一种思路。但它同时也提出了新的要求，过往芯片、云底座、模型和智能体开发平台之间，需要达成一种全新的平衡。而百度也交出了他们第一份答案。

当天，百度智能云将全面升级为面向大规模智能体应用的新全栈AI云，打造单位Token的智能水平最好的Agent Infra，和每瓦性能更强、性价比更高的 AI Infra，回应当前普遍的Agent落地难题。

1.智能体规模化落地，到底卡在哪儿？

2026年的AI云市场，正呈现一种矛盾的景象。

一面是需求强劲增长。 Gartner预测，2026年全球AI基础设施支出约1.37万亿美元，占AI总支出的一半以上；Synergy Research Group数据同样验证了全球AI云市场的强劲需求。其调研结果显示，2026年Q1全球云基础设施服务收入达1290亿美元，同比增长35%，年化收入运行率首次突破5000亿美元。

另一面，供给的繁荣并未顺畅转化为产业应用的繁荣。德勤《Tech Trends 2026》报告显示，38%的企业正在试点AI智能体，但仅11%已将其部署到实际生产环境，并未带来明显的商业收益。

落差从何而来？

百度创始人李彦宏提出的“日活智能体数”（Daily Active Agents，简称DAA）。逻辑很直接。移动互联网时代，DAU是衡量平台繁荣度的通用标尺；进入智能体时代，Token消耗一度被视为替代指标，但Token衡量的是成本而非收益，是投入而非产出。真正值得关注的，是有多少智能体在完成实际任务、交付实际结果。

这一观点触碰到了当前产业的深层矛盾。Token消耗量成倍增长，部分云厂商的算力从促销转为紧缺，但这些被消耗的Token，究竟转化成了多少业务产出？

从产业一线看，答案并不乐观。就以当前火爆的具身智能行业为例。单纯“堆卡”已经无法支撑机器人走进千行百业、千家万户的宏大愿景。具身智能企业真正需要的，是一整套从数据采集标注、模型训练到端侧推理的闭环系统，但能提供这种完整方案的供应商仍然稀缺。

智能体应用数量在增长，但多数卡在了“最后一公里”。模型能输出结论，却无法与既有业务系统顺畅衔接；Demo能跑通，却无法稳定运行于生产环境。

DAA真正衡量的，是一套能让Token穿过系统缝隙、转化为业务决策结果的基础设施能力，而这恰恰是当前行业供给中最薄弱的环节。

回顾过去两年，很多AI云厂商定义的“全栈”，本质上是分层清晰的产品清单：芯片、框架、模型、应用各司其职，每一层独立交付，协作靠客户自己的工程团队手动衔接。

在Chatbot时代，任务链路短、负载线性，这套拼图式供给尚可应对。但当一次对公授信需调用近十个系统，一次设备巡检需在大小模型间来回调度，模型、上下文、工具调用、算力调度、安全治理必须成为同一条任务链上紧密耦合的环节，任何一环断裂，整条链路就会失效。

行业调研普遍印证了这一趋势。麦肯锡2026年Q1的AI信任成熟度调查显示，近三分之二企业将安全与风险等基础治理问题列为首要障碍；德勤《Tech Trends 2026》则指出，60%的AI领导者将遗留系统整合视为首要障碍。

结论已经非常清晰，Agent具备了落地业务场景的基本能力，但与之配套的基础设施还没准备好。Token消耗反映市场热度，DAA反映智能体活跃度，两者之间的落差便是投入与产出之间的缺口，这正是当前行业需要直面的核心问题。

当头部企业在落地中普遍遭遇同一类瓶颈，供给方式的系统性调整就不可避免了。

2.百度“新全栈”，给出了什么解法？

模糊地认识到“需要协同”是容易的，难的是把它变成一套可运行、可交付的架构。

「甲子光年」梳理发现，百度智能云提出的“新全栈”，做了三个层面的架构决策：重新定义各层之间的关系；把基础设施拆成两个维度分别优化；在两层之间建立自动化的协同机制。

这套架构的底座，是百度智能云长期坚持的“芯云模体”全栈协同路线。昆仑芯与文心大模型的适配已深入到算子级别。当模型推理特征发生变化，底层芯片调度策略随之调整，让计算和通信尽量重叠，减少空转。这种从芯片到应用的全链条穿透力，是“新全栈”能够成立的前提。

在此之上，百度智能云把新全栈拆成两个维度——面向智能体任务的Agent Infra和面向底层算力效率的AI Infra。

Agent Infra的核心思路，是把模型能力通过一套工程系统稳定地交付为任务结果。百度智能云将这套系统拆成了两个升级点。

第一，Agent Harness。百度智能云宣布推出“Harness Engineering（驾驭工程）”，它集长上下文管理、持久记忆、工具调用、子智能体调度、评估反馈及Runtime等核心能力于一体，并深度适配Office、浏览器等企业常用工具，让智能体具备跨生态的任务执行能力。这套方案在使用浏览器、Office等典型办公场景中任务成功率可达95%，相比同类产品最高可降低23%的Token消耗。

第二，Token Factory（词元工厂）。这是百度智能云对模型服务层的重新定义，核心理念是“Agent-first”。传统MaaS平台卖的是裸Token，Token Factory则把长上下文与Cache管理、投机解码、全局推理资源调度等优化能力集成进推理服务，尽可能减少token的重复计算。目前在百度智能云上调用SOTA模型的速度比行业平均快25%。

Harness解决“智能体如何被构建”，模型服务解决“智能体如何高效运行”。彼此协同，尽可能缩短Token消耗与业务结果之间的距离。目前，这套Agent Infra已支撑百度伐谋、秒哒等垂直智能体及通用智能体DuMate的稳定运行，并支撑金融、能源、互联网、制造、教育、医疗、汽车等行业企业打造了高效能的智能体。

AI Infra的核心思路，则是让智能体跑得更快、成本更低、效果更好。百度智能云同样拆成了三个升级方向。

推理侧，通过对显存、内存到SSD的分层池化架构，将KV Cache命中率超过90%，达到业界最高水平。另外结合AFD分离、PD分离、缓存调度等优化方案，长链路Agent推理性能较主流开源社区引擎提升3倍。

训练侧，强化学习已成为智能体进化的核心路径，但Agent任务的Rollout采样效率是全行业卡点。通过提供全模态统一训练框架，让训练效率领先社区1倍以上，并可以在100 毫秒内拉起大量沙箱环境，提升强化学习的采样效率。Agentic模型强化学习效率提升1倍以上。

物理层，百度智能云基于昆仑芯系列构建了面向大规模训练和推理的算力基座。

在训练端，昆仑芯P800已完成规模化验证，2025年至今已交付多个万卡集群，实际支撑了文心5.1等重要大模型的稳定训练，其有效训练率97%和万卡线性扩展度超85%的表现，证明国产算力已具备支撑前沿模型全周期训练的工程可靠性。

在推理端，基于昆仑芯的天池256卡超节点已于上个月点亮，并将于6月正式上市，吞吐性能较上一代提升25%，推理效率提升50%，网络架构升级至HPN5.0后，端到端时延降低50%，可按需搭建数十万卡乃至百万卡超大集群；更关键的是，该超节点已预先完成对文心、DeepSeek、GLM、MiniMax等主流模型的深度适配，使模型服务层可以开箱即用地获得极致推理性能。

与此同时，百度智能云吉瓦级AIDC升级通过“网络向心布局”设计理念，让计算与网络距离最短，最大限度提升计算效率，并规模化落地风液兼容架构，使数据中心整体建设周期缩短约30%，为AI Infra的极致效率提供了物理保障。

但单层优化并不构成“新全栈”，毕竟其他云厂商同样在做推理加速和强化学习优化。真正的分水岭，在两层之间。

百度智能云让Agent Infra与AI Infra形成了深度耦合的动态反馈机制。当Agent Infra识别到某个智能体任务的上下文窗口急剧膨胀，会向AI Infra发出信号，Cache分层策略自动调整，从显存到内存腾挪空间。反向同理，AI Infra检测到负载走低，释放资源，Agent Infra随之切换调用策略。整个过程不需要人工介入。

“新”字的落脚点即在于此。它把旧全栈中由客户工程团队承担的“系统整合”，内化为百度智能云“芯云模体”自我进化的原生能力。

3.“新全栈”正在走进千行百业

检验一种新架构，最直接的方式是看它渗透进了哪些行业，以及这些行业的壁垒有多高。

2026年一季度，百度智能云在中国大模型公开中标市场，项目数量和金额双双位列第一。100%的系统重要性银行、80%的央企、800多家金融机构出现在它的客户名单里。中国实体经济里运转最精密、容错率最低的一批机构，已将AI推进核心业务环节。

Agent Infra的落地，最先在需要AI“干活”而非“聊天”的场景中被检验。

在国货出海领域，百度首次公开亮相的企业级智能营销解决方案Hogee，以及专为企业打造专属视觉智能体“一见Claw”。

其中，义乌提供了一个横跨视觉与营销的样本。基于一见视觉智能体，商家可以将海量规则自动配置到每个摄像头上，通过自然语言，一句话识别规则、完成流程处置；Hogee则通过内置的营销Skill，让“AI店长”帮助商家完成从销售导购、销售数据，到库存调货、促销建议等营销全链路工作，形成从生产到销售的闭环。

长安汽车的案例则展示了Agent Infra在智能驾驶场景中的渗透深度。

百度智能云在2023年就与长安汽车共建了算力规模达每秒142亿亿次的智算中心，基于百度百舸·AI 异构计算平台持续优化，支持长安汽车开展大模型、智能网联与自动驾驶研发相关业务。

依托全栈AI能力，百度智能云目前已成为100%中国主流车企选择，并持续领跑中国自动驾驶研发解决方案市场，累计支持2000万辆搭载 L2级辅助驾驶新车交付。

AI Infra的落地则回答了另一个问题：算力怎么被用足。

具身智能是最前沿的压力测试场景。百度集团执行副总裁、百度智能云事业群总裁沈抖表示，百度智能云在具身智能AI云市场以35%的份额居首，领先优势超过第二、第三名之和。

数据方面，百度智能云正在把十余年自动驾驶积累的数据服务能力迁移到具身场景；模型层面，依托百度智能云在大模型AI Infra领域的长期积累，典型VLA训练上加速超过70%，世界模型推理时延降低近50%，原本按周计的训练可以按天来跑。

具身智能目前处于从“技术验证”到“工程落地”的转折点上，这个阶段最稀缺的，正是能把数据、训练、推理串起来的全链条底座。35%的份额，说明这个底座正在被头部企业集中选择。

在硬件领域，百度智能云同样保持领先。其在智能手机、AI眼镜、扫地机器人、智能家电行业总计服务超1000家AI硬件厂商。

例如，百度智能云基于百度文心大模型和AI搜索打造的YOYO，在五一期间使用量明显提升。

金融和能源的案例，则在更长的时间维度上验证了同一件事。

浦发银行则基于昆仑芯精调金融分析专精模型，在多个场景提升金融意图识别准确率，其2025年资产总额突破10万亿元，对公贷款尽调效率显著提升。招商银行则部署了昆仑芯P800国产算力底座，已有超过800个AI应用跑在金融业务主流程，覆盖风控、营销、研发、办公等核心场景，超过50%的AI应用跑在国产算力上。

国产算力进入金融主流程，这个信号在今年信创周期重启的背景下格外值得关注，它意味着国产替代正在从“可用”走向“好用”。

国家电网和百度智能云的的合作则走过了十年，从2016年的智能客服，到2024年的千亿级光明电力大模型，再到2025年智能体在40余个场景落地。

变电站巡检是一个具体的场景侧写。传统AI小模型识别准确率只有五六成，用“大小模型融合”的智能体重构流程后，准确率提升到80%以上，巡视时间从2.5小时压缩到45分钟，覆盖全国800多座变电站。十年间每次升级都建立在上一阶段的业务数据和工程经验之上。这种“越用越好用”的交付方式，正在定义AI基础设施的下一代标准。

把这六个案例放在一起看，一条递进线索逐渐清晰。

Agent Infra让智能体在数字世界和物理世界里都能稳定地运转起来，AI Infra则确保支撑Agent运转的算力底座能够被充分使用，最终让Agent这项新技术真正转化为客户可见的业务价值。

从义乌的工厂到招行的柜台，从荣耀的手机到长安的产线，从具身智能的训练集群到国家电网的变电站。百度智能云“新全栈”已经跑通了一条从芯片到应用、从数字世界到物理世界的产业闭环。

4.新全栈之后，市场应当重估百度智能云

新全栈的提出，为重新理解百度智能云提供了一个切口。

当智能体落地成为产业主旋律，衡量标准正在发生根本性迁移，竞争焦点从“卖了多少算力”转向“支撑了多少智能体在生产环境稳定运行”。在新的坐标系中，过去被视为“重”的积累，开始显露出不同的分量。

这种重估建立在三个客观事实之上。

第一是客户结构的重估。

前文提到，百度智能云目前覆盖了100%的系统重要性银行、80%的央企及800多家金融机构，这些是中国实体经济中对稳定性、合规性、业务连续性要求最高的企业。

新全栈让这些客户将AI从基础问答推进至核心业务决策，一旦智能体深度嵌入对公授信、变电站巡检等主流程，其背后的架构便与百度智能云技术栈形成强绑定。客户结构的质量，正在转化为更深厚的竞争壁垒。

第二是交付方式的重估。

新全栈的Agent Infra与AI Infra深度耦合，使系统具备了持续进化的能力。国家电网十年的实践已经证明，这种“越用越好”的交付方式一旦建立，客户在长期协同中沉淀的不只是技术依赖，更是行业Know-how和信任关系。这是算力折扣无法换取的护城河。

第三是竞争身为的重估。

当多数厂商还在补足单层能力时，百度智能云已率先完成从芯片到应用的纵向拉通，并将系统整合能力内化为基础设施的原生能力。

这意味着新全栈不仅在交付当下，更在定义下一阶段的竞争规则。AI云竞赛正在从资源规模的比拼，转向系统效能的比拼。谁的架构能成为承载千万个智能体日常运转的默认底座，谁就掌握下一个十年的定价权。

这三重价值过去被折叠在“全栈”这个笼统的概念里。新全栈做了一件事，把百度智能云长期积累的纵向能力，在正确的产业节点上，重构为横向竞争力。芯片、框架、模型、应用被拉通成一个从算力到业务结果的完整闭环。

回到开篇保罗·大卫的叩问。电灯泡发明四十年后，当整条生产线围绕“电”彻底重构，工厂生产率才真正爆发。

历史正在重演。模型就位，算力就绪，智能体已越过技术临界点。但真正的分野在于，谁能把芯片、模型、工具链、安全治理浇筑成一座让智能体稳定运转的基座。

百度智能云的“新全栈”，就是对这道必答题的第一份完整答卷。从金融到能源，从数字世界到物理世界，多条Agent生产线已在这座基座上持续运转。这意味着，智能体规模化的产业进程，第一次有了属于自己的“电力系统”。而基座一旦成型，上层的想象力才刚刚开始。

（文中图片及封面图来源：百度）

END.

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。

用DAA衡量智能体 百度智能云用“新全栈”重新定义AI云｜甲子光年

用DAA衡量智能体百度智能云用“新全栈”重新定义AI云｜甲子光年