智元“部署态”落地，具身智能生产力走进现实

发布时间：2026-04-18来源：通往AGI之路

4月17日，智元在上海举办了一场叫APC2026的合作伙伴大会，来了30多个国家的2500多名伙伴，规模非常大。

CEO邓泰华和CTO彭志辉（稚晖君）分别做了主题演讲，还发了一堆新东西：

四款本体新品、六个AI大模型、七大产业解决方案、AIMA生态平台、以及「元苼」生态计划……

稚晖君在现场说，今天我们讨论的，不是几款新硬件，也不是几个新模型，而是一个关键的行业变革时机：具身智能正在从实验室，走向真实世界去做生产力的部署。

在这句话的背后，还有一个细节。

发布会前几天，他们在龙旗南昌的工厂产线上做了一场直播：一台智元机器人在高速流水线上连续工作了8小时，期间完成了2283项任务，全程零失误。

中途唯一的停顿，是因为后端工人去吃午饭了。

这意味着，具身智能行业迎来了一个划时代的节点，也就是CEO邓泰华说的：

2026年，是具身智能部署态元年。

从「开发态」到「部署态」

在之前，我们看到的那些机器人演示，更多是在开发态：

在专门布置过的场地，拉一台最好独立私人展示给你看，一出错就有工程师介入，它证明的是技术路线“理论上可行”。

智元今天宣布的，是下一步：部署态。

也就是说，人形机器人开始真正“上班”了。在真实工厂里，一天24小时、一周7天，自己稳定干活。

而且不是一台两台，是成百上千台同时跑，每一台都能快速部署、复制推广，真正帮企业省钱赚钱。

这两个状态之间的距离，比听起来要远。实验室里能成功，和真实产线上能成功，是两件完全不同的事。

产线上有光线变化、零件位置偏差、温度波动、工人走进视野……每一个在实验室里不存在的变量，到了现场都可能让机器人失手。

所以龙旗那个8小时零失误，不是在说这台机器人“很聪明”，是在说它“足够可靠”。

可靠，才是能干活的前提。

邓泰华说，当机器人能自主干活能独立创造价值，它就不再只是开发工具或者表演工具，而是生产力。这个产业价值会随着机器人干活能力的提升，不断扩展场景，从而带动部署规模的持续增加。

机器人怎么变聪明的

很多人可能会以为，只要提前把大模型训练好，装进机器人机身，机器人就能变聪明、能干活。

但这里有个问题，通用大模型学的是人类产生的文字和图像，数据海量，所以能很快学会很多事。

具身智能学的是机器人在物理世界的操作数据，机械臂怎么抓，腿怎么走，手碰到不同材质怎么施力，这类数据从哪来？

靠的就是机器人在真实生产线上运行产生的数据。

这就是过去几年具身智能一直差的那块拼图。预训练做好了，本体也有了，但物理操作数据太少，模型在真实场景里一碰就碎。

稚晖君的说法是，2026年具身智能能进入部署态，是因为三件事第一次同时成熟，大模型能理解世界了，本体的量产可靠性达标了，真实部署开始产生数据飞轮了。

缺哪一个都不行，就像火箭升空，推力、燃料、结构三样得同时到位。

其中最后这块是关键。部署的机器人越多，产生的真实操作数据越多，数据越多模型越强，模型越强机器人越可靠，就能部署到更多场景，飞轮就转起来了。

这个飞轮是部署驱动的，不是算法驱动的。

智元今年3月实现了行业里第一个累计万台下线，就是这个飞轮启动的基础。

六款模型 × 三层智能

有了真实数据，才能训练出真正能用的模型。这是稚晖君主要讲的部分，也是这次发布会里信息密度最高的地方。

他们这次一次发了六款AI模型，涵盖运动智能、作业智能、交互智能三层，这里挑几个说一下。

运动层的BFM，全称行为基座模型，这个有点不一样的地方在于，它不是「学一个动作」，而是「学动作的分布」。用了超过1亿帧、700小时的动作捕捉数据训练，让机器人具备零样本执行没见过的动作的能力。

生成式运控模型GCFM，是行业里第一个发布的生成式运控模型。你输入一句话：「做一个好奇的样子」，机器人就实时生成匹配的动作。以后创作者要给机器人设计动作，不用再学动作捕捉或者写代码了，输入描述，机器人就能理解。

作业层的GO-2，引入了「动作思维链」，就是机器人在执行任务之前，会在脑子里先推演每一步，确保规划出来的东西是实际可以执行的，不会出现「力矩不够」或者「这个角度手臂到不了」的情况。这个工作同时被CVPR和ACL两个顶会接收了，也就是说在计算机视觉和自然语言处理两个领域都被认可。

还有三季度即将发布的WITA Omni 1.0，是行业第一个机器人原生的端到端多模态交互大模型。现在的机器人交互是分段的，语音转文字，大模型推理，文字转语音，每次转换都在损失信息，语气、情绪、语调这些转成文字就没了。Omni把听觉、视觉、动作放进同一个模型里，让机器人看、听、动、说同时发生。发布会上灵犀X2在台上跟稚晖君聊天、握手的演示，用的就是这套。

大模型装进身体里，机器人“部署态”开机

说到本体，这次也发了四款：远征A3、灵犀X3、G2 Air、D2 Max。

6款模型装进4款新本体里，才能真正落地。

其中G2 Air的设计思路挺有意思，叫「人机合一数采」。意思是，人穿戴上特定设备，带着G2 Air在真实场景里干活，机器人就能同步学习，数据自然产生。

这是具身智能版的「影子模式」，而且G2 Air极致轻量，可以进800毫米的窄道，一个成年人可以轻松推着它，适合便利店、酒店、商超这种狭窄的商业空间。

还有远征A3，50公斤，12kW瞬间功率，双电池包热插拔，连续工作10小时不换电，稚晖君的定位是「为舞台而生的硅基明星」，适合商演、巡演场景。感觉很快就能在各种演出活动上看到了。

模型加本体，再加统一的架构，就是智元这次反复强调的「一体三智」。

一体，是稳定可靠的机器人本体，是一切的物理载体。三智，是三层智能，运动智能让机器人能动起来，交互智能提供服务生产力，作业智能提供劳动生产力。

稚晖君说，全球可能只有智元一家，同时具备这四层能力，而且完成了万台规模量产验证。

七大解决方案

能力有了，落地靠什么？

这次大会同步发布了7大部署态解决方案，分别是3C精密零件上下料、工业搬运拆码垛、物流分拣、导览导购导引、服务零售站、安防巡检、工商业清洁。

这7个场景的选法有一个共同逻辑，高重复性、高危险性、招人越来越难，而且都选了连锁头部客户。

龙旗、富临精工、上汽、安踏、海底捞，一个场景跑通，可以直接复制到同类的几千个场景里。

龙旗南昌产线并线一个多月了，富临精工和上汽已经常态化运行，物流分拣跑通半年了，海外复制已经启动。这些都是已经在跑的场景。

还有跟安踏的零售场景战略合作，跟海底捞的餐饮场景战略合作，现在在推进真实的运营场景，比如高峰期的排队、引位、叫号。

这些加在一起，能大概看出，智元在做的事不是在等一个「技术成熟的未来」，而是把能做的场景，一个个挑出来，在真实环境里把它跑通，建立口碑，然后开始复制。

稚晖君说了一句话，我觉得是整场大会最准确的定性，“我们的逻辑，从最早的两年卖机器人，要变成交付结果。”

七个解决方案的落地，方案的一小步，是生产力的一大步。

AIMA生态与「元苼」计划

然后稚晖君顺手亮出了他们的生态底牌，为了让更多合作伙伴也能基于这套能力做开发，他们做了一个叫AIMA的全栈生态平台。

包括原生适配具身智能的开源操作系统灵渠OS、动作内容创作平台灵创、机器人个性定制平台灵心，以及作业智能一站式开发平台Genie Studio。

四个平台，覆盖从创意到工业，从个性化到量产。

另外，他们还宣布了一个叫「元苼」的生态计划，未来五年投入20多亿，用来扶持科研、培养人才、支持开发者社区。

这对于很多大公司项目来说可能并不算什么，但重要的是，他们在做一件以前机器人公司不怎么做的事，把生态这件事当成战略来推。

具身智能生产力走进现实

具身智能行业经历了很多阶段。最开始是遥远的未来，然后是很快要来，然后是被反复提起的泡沫，现在好像真的到了一个很微妙的时间点：具身智能的真正落地，正在发生。

稚晖君在演讲的开始，就抛出了一个问题：黄仁勋说Token是AI时代的货币。那AI时代最大的Token消费者是谁？

他的答案是：具身智能体。

现在看来，确实很有道理。

当机器人大规模部署之后，物理世界本身就会变成一个巨大的计算场，每一台机器人都在持续消耗算力，也在持续产生数据。这个规模一旦上来，可能真的会超过现在所有数字世界的AI应用。

或许AGI最终的形态，不只是一个超级聪明的「大脑」，它还需要有可以在物理世界行动的「手和脚」。不然思考再厉害，也只存在于屏幕后面，影响不了物理世界。

从这个角度看，具身智能不是机器人产业自己的事，而是AGI路线图上必须走的一步，让AI从数字世界走出来，真正进入物理世界。

很多人会觉得，机器人在高速流水线上连续工作8小时是件很遥远的事。

但现在，它已经在悄悄发生了。

👀 近期看点

全球AI大会全记录：企业、创作与IP，正在被AI重新定义

全球AI大会2026精华总结，上午七场演讲一文看完

WaytoAGI北京亦庄OPC大楼开放！OPC入驻招募中

最适合普通人的满配Agent，扣子2.5开箱！

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。