智元“部署态”落地,具身智能生产力走进现实
4月17日,智元在上海举办了一场叫APC2026的合作伙伴大会,来了30多个国家的2500多名伙伴,规模非常大。

CEO邓泰华和CTO彭志辉(稚晖君)分别做了主题演讲,还发了一堆新东西:
四款本体新品、六个AI大模型、七大产业解决方案、AIMA生态平台、以及「元苼」生态计划……
稚晖君在现场说,今天我们讨论的,不是几款新硬件,也不是几个新模型,而是一个关键的行业变革时机:具身智能正在从实验室,走向真实世界去做生产力的部署。
在这句话的背后,还有一个细节。
发布会前几天,他们在龙旗南昌的工厂产线上做了一场直播:一台智元机器人在高速流水线上连续工作了8小时,期间完成了2283项任务,全程零失误。
中途唯一的停顿,是因为后端工人去吃午饭了。

这意味着,具身智能行业迎来了一个划时代的节点,也就是CEO邓泰华说的:
2026年,是具身智能部署态元年。
从「开发态」到「部署态」
在之前,我们看到的那些机器人演示,更多是在开发态:
在专门布置过的场地,拉一台最好独立私人展示给你看,一出错就有工程师介入,它证明的是技术路线“理论上可行”。
智元今天宣布的,是下一步:部署态。
也就是说,人形机器人开始真正“上班”了。在真实工厂里,一天24小时、一周7天,自己稳定干活。
而且不是一台两台,是成百上千台同时跑,每一台都能快速部署、复制推广,真正帮企业省钱赚钱。
这两个状态之间的距离,比听起来要远。实验室里能成功,和真实产线上能成功,是两件完全不同的事。
产线上有光线变化、零件位置偏差、温度波动、工人走进视野……每一个在实验室里不存在的变量,到了现场都可能让机器人失手。
所以龙旗那个8小时零失误,不是在说这台机器人“很聪明”,是在说它“足够可靠”。
可靠,才是能干活的前提。
邓泰华说,当机器人能自主干活能独立创造价值,它就不再只是开发工具或者表演工具,而是生产力。这个产业价值会随着机器人干活能力的提升,不断扩展场景,从而带动部署规模的持续增加。
机器人怎么变聪明的
很多人可能会以为,只要提前把大模型训练好,装进机器人机身,机器人就能变聪明、能干活。
但这里有个问题,通用大模型学的是人类产生的文字和图像,数据海量,所以能很快学会很多事。
具身智能学的是机器人在物理世界的操作数据,机械臂怎么抓,腿怎么走,手碰到不同材质怎么施力,这类数据从哪来?
靠的就是机器人在真实生产线上运行产生的数据。
这就是过去几年具身智能一直差的那块拼图。预训练做好了,本体也有了,但物理操作数据太少,模型在真实场景里一碰就碎。
稚晖君的说法是,2026年具身智能能进入部署态,是因为三件事第一次同时成熟,大模型能理解世界了,本体的量产可靠性达标了,真实部署开始产生数据飞轮了。
缺哪一个都不行,就像火箭升空,推力、燃料、结构三样得同时到位。
其中最后这块是关键。部署的机器人越多,产生的真实操作数据越多,数据越多模型越强,模型越强机器人越可靠,就能部署到更多场景,飞轮就转起来了。

这个飞轮是部署驱动的,不是算法驱动的。
智元今年3月实现了行业里第一个累计万台下线,就是这个飞轮启动的基础。
六款模型 × 三层智能
有了真实数据,才能训练出真正能用的模型。这是稚晖君主要讲的部分,也是这次发布会里信息密度最高的地方。
他们这次一次发了六款AI模型,涵盖运动智能、作业智能、交互智能三层,这里挑几个说一下。
运动层的BFM,全称行为基座模型,这个有点不一样的地方在于,它不是「学一个动作」,而是「学动作的分布」。用了超过1亿帧、700小时的动作捕捉数据训练,让机器人具备零样本执行没见过的动作的能力。
生成式运控模型GCFM,是行业里第一个发布的生成式运控模型。你输入一句话:「做一个好奇的样子」,机器人就实时生成匹配的动作。以后创作者要给机器人设计动作,不用再学动作捕捉或者写代码了,输入描述,机器人就能理解。
作业层的GO-2,引入了「动作思维链」,就是机器人在执行任务之前,会在脑子里先推演每一步,确保规划出来的东西是实际可以执行的,不会出现「力矩不够」或者「这个角度手臂到不了」的情况。这个工作同时被CVPR和ACL两个顶会接收了,也就是说在计算机视觉和自然语言处理两个领域都被认可。
还有三季度即将发布的WITA Omni 1.0,是行业第一个机器人原生的端到端多模态交互大模型。现在的机器人交互是分段的,语音转文字,大模型推理,文字转语音,每次转换都在损失信息,语气、情绪、语调这些转成文字就没了。Omni把听觉、视觉、动作放进同一个模型里,让机器人看、听、动、说同时发生。发布会上灵犀X2在台上跟稚晖君聊天、握手的演示,用的就是这套。
大模型装进身体里,机器人“部署态”开机

说到本体,这次也发了四款:远征A3、灵犀X3、G2 Air、D2 Max。
6款模型装进4款新本体里,才能真正落地。
其中G2 Air的设计思路挺有意思,叫「人机合一数采」。意思是,人穿戴上特定设备,带着G2 Air在真实场景里干活,机器人就能同步学习,数据自然产生。
这是具身智能版的「影子模式」,而且G2 Air极致轻量,可以进800毫米的窄道,一个成年人可以轻松推着它,适合便利店、酒店、商超这种狭窄的商业空间。
还有远征A3,50公斤,12kW瞬间功率,双电池包热插拔,连续工作10小时不换电,稚晖君的定位是「为舞台而生的硅基明星」,适合商演、巡演场景。感觉很快就能在各种演出活动上看到了。
模型加本体,再加统一的架构,就是智元这次反复强调的「一体三智」。
一体,是稳定可靠的机器人本体,是一切的物理载体。三智,是三层智能,运动智能让机器人能动起来,交互智能提供服务生产力,作业智能提供劳动生产力。
稚晖君说,全球可能只有智元一家,同时具备这四层能力,而且完成了万台规模量产验证。
七大解决方案
能力有了,落地靠什么?
这次大会同步发布了7大部署态解决方案,分别是3C精密零件上下料、工业搬运拆码垛、物流分拣、导览导购导引、服务零售站、安防巡检、工商业清洁。

这7个场景的选法有一个共同逻辑,高重复性、高危险性、招人越来越难,而且都选了连锁头部客户。
龙旗、富临精工、上汽、安踏、海底捞,一个场景跑通,可以直接复制到同类的几千个场景里。
龙旗南昌产线并线一个多月了,富临精工和上汽已经常态化运行,物流分拣跑通半年了,海外复制已经启动。这些都是已经在跑的场景。
还有跟安踏的零售场景战略合作,跟海底捞的餐饮场景战略合作,现在在推进真实的运营场景,比如高峰期的排队、引位、叫号。
这些加在一起,能大概看出,智元在做的事不是在等一个「技术成熟的未来」,而是把能做的场景,一个个挑出来,在真实环境里把它跑通,建立口碑,然后开始复制。
稚晖君说了一句话,我觉得是整场大会最准确的定性,“我们的逻辑,从最早的两年卖机器人,要变成交付结果。”
七个解决方案的落地,方案的一小步,是生产力的一大步。
AIMA生态与「元苼」计划
然后稚晖君顺手亮出了他们的生态底牌,为了让更多合作伙伴也能基于这套能力做开发,他们做了一个叫AIMA的全栈生态平台。
包括原生适配具身智能的开源操作系统灵渠OS、动作内容创作平台灵创、机器人个性定制平台灵心,以及作业智能一站式开发平台Genie Studio。

四个平台,覆盖从创意到工业,从个性化到量产。
另外,他们还宣布了一个叫「元苼」的生态计划,未来五年投入20多亿,用来扶持科研、培养人才、支持开发者社区。
这对于很多大公司项目来说可能并不算什么,但重要的是,他们在做一件以前机器人公司不怎么做的事,把生态这件事当成战略来推。

具身智能生产力走进现实
具身智能行业经历了很多阶段。最开始是遥远的未来,然后是很快要来,然后是被反复提起的泡沫,现在好像真的到了一个很微妙的时间点:具身智能的真正落地,正在发生。
稚晖君在演讲的开始,就抛出了一个问题:黄仁勋说Token是AI时代的货币。那AI时代最大的Token消费者是谁?
他的答案是:具身智能体。
现在看来,确实很有道理。
当机器人大规模部署之后,物理世界本身就会变成一个巨大的计算场,每一台机器人都在持续消耗算力,也在持续产生数据。这个规模一旦上来,可能真的会超过现在所有数字世界的AI应用。
或许AGI最终的形态,不只是一个超级聪明的「大脑」,它还需要有可以在物理世界行动的「手和脚」。不然思考再厉害,也只存在于屏幕后面,影响不了物理世界。
从这个角度看,具身智能不是机器人产业自己的事,而是AGI路线图上必须走的一步,让AI从数字世界走出来,真正进入物理世界。
很多人会觉得,机器人在高速流水线上连续工作8小时是件很遥远的事。
但现在,它已经在悄悄发生了。
