机器人前瞻(公众号:robot_pro)




作者|葛文婷




编辑|漠影



机器人前瞻4月27日报道,今天,小米正式发布


Xiaomi-Robotics-0真机后训练(Post-training)全流程并开源







Xiaomi-Robotics-0


是小米于2026年2月发布的VLA模型,发布首月便登上HuggingFace全球VLA模型下载榜第六名。该模型包含4.7B参数,旨在解决机器人在实时作业场景下推理延迟、动作连贯性不足、能力遗忘等问题。



小米表示,


真机后训练是打通VLA模型(视觉-语言-动作模型)迈向落地“最后一公里”的关键。


团队全面公布整套训练流程,旨在降低机器人智能化技术门槛,加速具身智能产业落地。



在本次真机后训练中,小米团队引入的自适应加权机制(Adaptive Loss Re-weighting)、Λ型掩码(Λ-Shape Attention Mask)和前缀动作随机遮蔽(Random Masking)三项技术,


有效破解了业内普遍存在的“偷懒效应”问题





Xiaomi-Robotics-0仅需20小时任务数据即可连续完成多组耳机收纳任务。




以下是Xiaomi-Robotics-0的相关技术、开源链接:






  • 技术官网:https://robotics.xiaomi.com








  • 技术报告:https://arxiv.org/abs/2602.12684








  • 项目网站:https://robotics.xiaomi.com/xiaomi-robotics-0.html








  • 模型权重:https://huggingface.co/XiaomiRobotics








  • 开源代码:https://github.com/XiaomiRobotics/Xiaomi-Robotics-0






一、基于预训练基座,仅需20小时任务数据就能学会精细操作



在收纳耳机任务中,Xiaomi-Robotics-0面临着


两项核心挑战





1、


耳机与收纳槽位尺寸匹配精密、公差小


,模型必须达到亚毫米级的空间感知精度,才能把耳机精准地放回耳机槽中。



2、


耳机与盒体表面粗糙度最低至Ra0.03μm(堪比高品质单反镜头镜片)


,机器人在收纳耳机时极易出现位置偏移,模型必须能快速修正动作偏差,避免装配失败。



针对以上挑战,该团队依托包含约


2亿步机器人运动轨迹数据





超8000万条视觉及语言样本


的预训练基座,仅通过


20小时任务数据


完成真机后训练,便能让Xiaomi-Robotics-0掌握收纳耳机的精细操作,并连续完成多组耳机收纳任务。



小米开源,让机器人不再偷懒!




二、三项技术攻克“偷懒效应”,打造机器人的通用能力



此外,小米表示,为了实现机器人动作的无缝衔接,该团队在部署阶段采用了


异步推理(Asynchronous Execution)方案


,即让机器人在执行当前动作时,同步推理下一步动作。



同时,为了确保模型前后两次推理生成的动作轨迹不发生突变,该团队在训练中引入了


动作前缀(Action Prefixing)


,它能够让机器人基于已有动作轨迹衍生全新动作,实现多类动作之间的无缝衔接、丝滑切换。



不过,在引入动作前缀(Action Prefixing)之后,一个业内通病——


“偷懒效应”


也随之而来。



偷懒效应指的是


模型容易过度依赖动作惯性而选择性地忽视实时视觉反馈。




为了解决这个通病,小米团队引入了


自适应加权机制(Adaptive Loss Re-weighting)





Λ型掩码(Λ-Shape Attention Mask)





前缀动作随机遮蔽(Random Masking)


三项技术,以此来平衡机器人的动作连贯性与响应灵敏度:






  • 自适应加权机制(Adaptive Loss Re-weighting)


    :根据模型预测值与真实轨迹的偏差,动态调整Loss权重(误差的惩罚力度),引导模型针对性修正关键误差、补齐能力短板。



小米开源,让机器人不再偷懒!






  • Λ型掩码(Λ-Shape Attention Mask):


    通过特殊的注意力机制,确保模型在参考前段动作末尾的同时,保持对当前视觉信号的高度专注,防止陷入单纯的“路径依赖”。



小米开源,让机器人不再偷懒!






  • 前缀动作随机遮蔽(Random Masking):


    在训练中对既有的动作前缀进行随机Dropout(即随机、不定时地让机器人运动控制网络中的部分神经元失效,不参与计算和更新),倒逼模型深入挖掘摄像头画面与传感器信号,学会通用能力,而非盲目跟从动作惯性。



小米开源,让机器人不再偷懒!




结语:降低训练成本,为解决“偷懒效应”提供了新的技术方案



小米发布Xiaomi-Robotics-0真机后训练全流程并开源,不仅有助于开发者们利用Xiaomi-Robotics-0在各式各样的场景中,通过极低的真机后训练成本,训练出属于自己的 “专属机器人”,还为业内解决机器人的“偷懒效应”提供了新的技术方案。



小米透露,其将在多样化的硬件本体上持续开展跨本体通用能力的部署、测试与验证,并不断迭代模型,全面强化具身智能的泛化能力与落地效果。