深度|具身界的张雪飞车:具身奥运,中国企业击败最强具身大脑 PI 拿下 3 项第一

据 Z Finance 获悉,在全球具身灵巧操作难度顶尖的真机赛事——Benjie's Humanoid Olympic Games(以下简称Benjie's Olympics)中,来自中国的企业星动纪元凭借自研VLA具身模型,一举斩获该赛事剥橘子、开锁、翻袜子三项任务全球第一。
这不仅是中国企业首次在该赛事中登顶,更关键的是,它在三项核心任务中,以显著优势击败了被誉为"全球最强具身大脑公司之一"的Physical Intelligence(简称PI)。要知道,此前各项具身智能赛事中PI身影的出现并非主动参与了赛事,而是第三方拿PI开源模型打的成绩,而本次Benjie's Olympics是PI唯一参与的具身赛事,参赛模型为最新闭源模型PI*0.6,也是具身智能领域公认的最强模型。

星动纪元与PI在剥橘子、开锁、翻袜子任务中的成绩对比
具身灵巧操作奥林匹克,全球最难的具身赛事
Benjie's Olympics由前Google资深机器人专家Benjie Holson发起,初心是提出真正能衡量机器人核心价值的评判体系——即“炫技表演” 走向 “实用落地”。该比赛被科学美国人杂志(Scientific American)认为是机器人终极挑战,直击具身智能的核心命题——莫拉维克悖论:人类习以为常的日常感知与动作(如叠衣服、用钥匙开锁等),对机器人而言是极高难度的挑战。
赛事按难度等级分为金牌任务、银牌任务和铜牌任务,只有每项任务获得第一,才能摘得对应的奖牌。赛事汇聚了PI 、Sunday Robotics等全球顶尖具身智能公司,这也是PI唯一主动参与的赛事,其参赛所用的闭源模型(π*0.6),代表了PI大脑能力的最高水准,赛事结果反映了当前具身智能领域的最高水平。
三项任务大幅超越 PI,刷新全球第一纪录
近期,Benjie's Olympics正式宣布星动纪元在剥橘子、开锁、翻袜子三大核心任务中,均以显著优势超越前纪录保持者PI。

Benjie's Olympics公布, 星动纪元获两项金牌难度任务(剥橘子、开锁)第一

Benjie's Olympics公布,星动纪元获银牌难度任务(翻袜子)第一
剥橘子(金牌难度任务):「首个无工具纯手剥,比 PI 速度快35%」
任务难点:要求机器人精准区分果皮与果肉的细微视觉特征,实时跟踪剥制过程中的果皮形变,要求视觉感知有极高的鲁棒性。
PI 成绩:借助削皮刀工具, 2分46秒完成。
星动纪元成绩:首个实现完全无工具纯手剥操作的团队,纯手剥1分47秒完成,速度提升35%。
开锁(金牌难度任务):「比 PI 速度快 25%」
任务难点:钥匙孔为毫米级微小目标,要求机器人精准识别钥匙孔的位置、角度,同时完成钥匙的姿态理解,实现毫米级对准,还需克服光照变化、金属反光、视角偏差等多重干扰,对视觉感知的精度与鲁棒性要求严苛。
PI 成绩:66秒完成
星动纪元成绩:49秒完成,速度提升25%
翻袜子(银牌难度任务):「比 PI 样本量少 32%,速度快 30%」
任务难点:作为检验模型家用泛化能力的核心标杆,该任务是柔性物体操作、样本泛化、效率敏感的典型场景,袜子翻转过程中会发生复杂、无规律的形变,要求机器人实时跟踪形变,精准区分袜子的内外侧、开口位置,对视觉感知、柔性物体跟踪能力要求极高。
PI 成绩:1分33秒完成,176个样本
星动纪元成绩:比PI速度提升30%,120个样本,样本使用量少32%
此次,星动纪元作为唯一上榜的中国具身智能企业,在Benjie's Olympics中斩获三项任务全球第一并刷新世界纪录,这也是星动纪元在具身模型能力上的又一重要成果。
星动纪元,具身智能界的张雪飞车
2月底,星动纪元陈建宇团队才在世界模型权威测评WorldArena榜单中超越谷歌、英伟达斩获具身任务全球第一。
结合此次,星动纪元1个月拿下4项全球第一,如果长期跟踪星动纪元,说一句具身智能界的 “张雪飞车”不为过。两者都是:长期蛰伏、技术打底、低调深耕、突然爆发、碾压国际一线、以中国力量登顶全球。
在这之前,星动纪元的具身大脑在研究范式、技术引领和应用落地上已经取得:
中国唯一,全球1/4:ERA-42已实现全尺寸人形机器人全身及五指灵巧手精准控制;其余三个为Figure Helix,特斯拉Grok及英伟达GR00T。
全球首提分频VLA:2024年9月, 推出HiRT快慢分层架构,通过latent向量连接70亿参数世界模型与4000万参数执行模型;2024年10月到2025年3月,PI、Figure、Google、NVIDIA 相继发布分频VLA。
全球首个融合世界模型的具身大脑:2024年12月,发布融合世界模型的VLA算法框架VPP(Video Prediction Policy,现已开源),将具身智能可用数据扩展至海量互联网视频数据,机器人得以理解“物理世界”,边想边做。
2025年10月,清华陈建宇团队联合斯坦福 Chelsea Finn团队(PI联创)提出可控生成世界模型 “Ctrl-World” —— 让机器人在 “想象空间” 中完成任务预演、策略评估与自我迭代,将机器人在陌生场景下游任务平均成功率提升了44.7%。
2026年2月,清华陈建宇(星动纪元创始人)团队和斯坦福 Chelsea Finn(PI 创始人) 团队基于 Ctrl-World (两个团队的首个合作成果),再度携手,联合提出了 VLAW 框架,首次实现了 VLA 策略与动作条件世界模型的协同迭代优化,让两者形成一个「互相促进的闭环」:
VLA 策略采集的真实交互数据,反过来用于提升世界模型的物理保真度;
世界模型生成的高质量虚拟数据,再用于持续强化VLA 策略本身。
目前,具身大脑ERA-42已在物流、制造、商业服务等多个领域落地,形成了“场景越丰富,模型越智能” 的正向循环——在物流领域,可完成药品、日化品、包裹的分拣及扫码;在制造领域,重点突破“零部件抓取 - 高精度装配 - 质量检测” 等场景任务;在商业服务领域,可完成门店客座清洁、物品递送、导游导览等。其中,部分场景效率当前达到70%。


稿件经采用可获邀进入Z Finance内部社群,优秀者将成为签约作者,00后更有机会成为Z Finance的早期共创成员。


