小米开源，让机器人不再偷懒！

发布时间：2026-04-26来源：芯东西

机器人前瞻（公众号：robot_pro）

作者｜葛文婷

编辑｜漠影

机器人前瞻4月27日报道，今天，小米正式发布

Xiaomi-Robotics-0真机后训练（Post-training）全流程并开源

。

Xiaomi-Robotics-0

是小米于2026年2月发布的VLA模型，发布首月便登上HuggingFace全球VLA模型下载榜第六名。该模型包含4.7B参数，旨在解决机器人在实时作业场景下推理延迟、动作连贯性不足、能力遗忘等问题。

小米表示，

真机后训练是打通VLA模型（视觉-语言-动作模型）迈向落地“最后一公里”的关键。

团队全面公布整套训练流程，旨在降低机器人智能化技术门槛，加速具身智能产业落地。

在本次真机后训练中，小米团队引入的自适应加权机制(Adaptive Loss Re-weighting)、Λ型掩码(Λ-Shape Attention Mask)和前缀动作随机遮蔽(Random Masking)三项技术，

有效破解了业内普遍存在的“偷懒效应”问题

。

Xiaomi-Robotics-0仅需20小时任务数据即可连续完成多组耳机收纳任务。

以下是Xiaomi-Robotics-0的相关技术、开源链接：

技术官网：https://robotics.xiaomi.com

技术报告：https://arxiv.org/abs/2602.12684

项目网站：https://robotics.xiaomi.com/xiaomi-robotics-0.html

模型权重：https://huggingface.co/XiaomiRobotics

开源代码：https://github.com/XiaomiRobotics/Xiaomi-Robotics-0

一、基于预训练基座，仅需20小时任务数据就能学会精细操作

在收纳耳机任务中，Xiaomi-Robotics-0面临着

两项核心挑战

：

1、

耳机与收纳槽位尺寸匹配精密、公差小

，模型必须达到亚毫米级的空间感知精度，才能把耳机精准地放回耳机槽中。

2、

耳机与盒体表面粗糙度最低至Ra0.03μm（堪比高品质单反镜头镜片）

，机器人在收纳耳机时极易出现位置偏移，模型必须能快速修正动作偏差，避免装配失败。

针对以上挑战，该团队依托包含约

2亿步机器人运动轨迹数据

和

超8000万条视觉及语言样本

的预训练基座，仅通过

20小时任务数据

完成真机后训练，便能让Xiaomi-Robotics-0掌握收纳耳机的精细操作，并连续完成多组耳机收纳任务。

小米开源，让机器人不再偷懒！

二、三项技术攻克“偷懒效应”，打造机器人的通用能力

此外，小米表示，为了实现机器人动作的无缝衔接，该团队在部署阶段采用了

异步推理（Asynchronous Execution）方案

，即让机器人在执行当前动作时，同步推理下一步动作。

同时，为了确保模型前后两次推理生成的动作轨迹不发生突变，该团队在训练中引入了

动作前缀（Action Prefixing）

，它能够让机器人基于已有动作轨迹衍生全新动作，实现多类动作之间的无缝衔接、丝滑切换。

不过，在引入动作前缀（Action Prefixing）之后，一个业内通病——

“偷懒效应”

也随之而来。

偷懒效应指的是

模型容易过度依赖动作惯性而选择性地忽视实时视觉反馈。

为了解决这个通病，小米团队引入了

自适应加权机制(Adaptive Loss Re-weighting)

、

Λ型掩码(Λ-Shape Attention Mask)

和

前缀动作随机遮蔽(Random Masking)

三项技术，以此来平衡机器人的动作连贯性与响应灵敏度：

自适应加权机制(Adaptive Loss Re-weighting)

：根据模型预测值与真实轨迹的偏差，动态调整Loss权重（误差的惩罚力度），引导模型针对性修正关键误差、补齐能力短板。

小米开源，让机器人不再偷懒！

Λ型掩码(Λ-Shape Attention Mask)：

通过特殊的注意力机制，确保模型在参考前段动作末尾的同时，保持对当前视觉信号的高度专注，防止陷入单纯的“路径依赖”。

小米开源，让机器人不再偷懒！

前缀动作随机遮蔽(Random Masking)：

在训练中对既有的动作前缀进行随机Dropout（即随机、不定时地让机器人运动控制网络中的部分神经元失效，不参与计算和更新），倒逼模型深入挖掘摄像头画面与传感器信号，学会通用能力，而非盲目跟从动作惯性。

小米开源，让机器人不再偷懒！

结语：降低训练成本，为解决“偷懒效应”提供了新的技术方案

小米发布Xiaomi-Robotics-0真机后训练全流程并开源，不仅有助于开发者们利用Xiaomi-Robotics-0在各式各样的场景中，通过极低的真机后训练成本，训练出属于自己的 “专属机器人”，还为业内解决机器人的“偷懒效应”提供了新的技术方案。

小米透露，其将在多样化的硬件本体上持续开展跨本体通用能力的部署、测试与验证，并不断迭代模型，全面强化具身智能的泛化能力与落地效果。

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。

小米开源，让机器人不再偷懒！

技术官网：https://robotics.xiaomi.com

技术报告：https://arxiv.org/abs/2602.12684

项目网站：https://robotics.xiaomi.com/xiaomi-robotics-0.html

模型权重：https://huggingface.co/XiaomiRobotics

开源代码：https://github.com/XiaomiRobotics/Xiaomi-Robotics-0

一、基于预训练基座，仅需20小时任务数据就能学会精细操作

二、三项技术攻克“偷懒效应”，打造机器人的通用能力

结语：降低训练成本，为解决“偷懒效应”提供了新的技术方案