深度｜具身界的张雪飞车：具身奥运，中国企业击败最强具身大脑 PI 拿下 3 项第一

发布时间：2026-04-10来源：Z Finance

据 Z Finance 获悉，在全球具身灵巧操作难度顶尖的真机赛事——Benjie's Humanoid Olympic Games（以下简称Benjie's Olympics）中，来自中国的企业星动纪元凭借自研VLA具身模型，一举斩获该赛事剥橘子、开锁、翻袜子三项任务全球第一。

这不仅是中国企业首次在该赛事中登顶，更关键的是，它在三项核心任务中，以显著优势击败了被誉为"全球最强具身大脑公司之一"的Physical Intelligence（简称PI）。要知道，此前各项具身智能赛事中PI身影的出现并非主动参与了赛事，而是第三方拿PI开源模型打的成绩，而本次Benjie's Olympics是PI唯一参与的具身赛事，参赛模型为最新闭源模型PI*0.6，也是具身智能领域公认的最强模型。

星动纪元与PI在剥橘子、开锁、翻袜子任务中的成绩对比

具身灵巧操作奥林匹克，全球最难的具身赛事

Benjie's Olympics由前Google资深机器人专家Benjie Holson发起，初心是提出真正能衡量机器人核心价值的评判体系——即“炫技表演” 走向 “实用落地”。该比赛被科学美国人杂志（Scientific American）认为是机器人终极挑战，直击具身智能的核心命题——莫拉维克悖论：人类习以为常的日常感知与动作（如叠衣服、用钥匙开锁等），对机器人而言是极高难度的挑战。

赛事按难度等级分为金牌任务、银牌任务和铜牌任务，只有每项任务获得第一，才能摘得对应的奖牌。赛事汇聚了PI 、Sunday Robotics等全球顶尖具身智能公司，这也是PI唯一主动参与的赛事，其参赛所用的闭源模型（π*0.6），代表了PI大脑能力的最高水准，赛事结果反映了当前具身智能领域的最高水平。

三项任务大幅超越 PI，刷新全球第一纪录

近期，Benjie's Olympics正式宣布星动纪元在剥橘子、开锁、翻袜子三大核心任务中，均以显著优势超越前纪录保持者PI。

Benjie's Olympics公布，星动纪元获两项金牌难度任务（剥橘子、开锁）第一

Benjie's Olympics公布，星动纪元获银牌难度任务（翻袜子）第一

剥橘子（金牌难度任务）：「首个无工具纯手剥，比 PI 速度快35%」

任务难点：要求机器人精准区分果皮与果肉的细微视觉特征，实时跟踪剥制过程中的果皮形变，要求视觉感知有极高的鲁棒性。
PI 成绩：借助削皮刀工具， 2分46秒完成。
星动纪元成绩：首个实现完全无工具纯手剥操作的团队，纯手剥1分47秒完成，速度提升35%。

开锁（金牌难度任务）：「比 PI 速度快 25%」

任务难点：钥匙孔为毫米级微小目标，要求机器人精准识别钥匙孔的位置、角度，同时完成钥匙的姿态理解，实现毫米级对准，还需克服光照变化、金属反光、视角偏差等多重干扰，对视觉感知的精度与鲁棒性要求严苛。
PI 成绩：66秒完成
星动纪元成绩：49秒完成，速度提升25%

翻袜子（银牌难度任务）：「比 PI 样本量少 32%，速度快 30%」

任务难点：作为检验模型家用泛化能力的核心标杆，该任务是柔性物体操作、样本泛化、效率敏感的典型场景，袜子翻转过程中会发生复杂、无规律的形变，要求机器人实时跟踪形变，精准区分袜子的内外侧、开口位置，对视觉感知、柔性物体跟踪能力要求极高。
PI 成绩：1分33秒完成，176个样本
星动纪元成绩：比PI速度提升30%，120个样本，样本使用量少32%

此次，星动纪元作为唯一上榜的中国具身智能企业，在Benjie's Olympics中斩获三项任务全球第一并刷新世界纪录，这也是星动纪元在具身模型能力上的又一重要成果。

星动纪元，具身智能界的张雪飞车

2月底，星动纪元陈建宇团队才在世界模型权威测评WorldArena榜单中超越谷歌、英伟达斩获具身任务全球第一。

结合此次，星动纪元1个月拿下4项全球第一，如果长期跟踪星动纪元，说一句具身智能界的 “张雪飞车”不为过。两者都是：长期蛰伏、技术打底、低调深耕、突然爆发、碾压国际一线、以中国力量登顶全球。

在这之前，星动纪元的具身大脑在研究范式、技术引领和应用落地上已经取得：

中国唯一，全球1/4：ERA-42已实现全尺寸人形机器人全身及五指灵巧手精准控制；其余三个为Figure Helix，特斯拉Grok及英伟达GR00T。

全球首提分频VLA：2024年9月，推出HiRT快慢分层架构，通过latent向量连接70亿参数世界模型与4000万参数执行模型；2024年10月到2025年3月，PI、Figure、Google、NVIDIA 相继发布分频VLA。

全球首个融合世界模型的具身大脑：2024年12月，发布融合世界模型的VLA算法框架VPP（Video Prediction Policy，现已开源），将具身智能可用数据扩展至海量互联网视频数据，机器人得以理解“物理世界”，边想边做。

2025年10月，清华陈建宇团队联合斯坦福 Chelsea Finn团队（PI联创）提出可控生成世界模型 “Ctrl-World” —— 让机器人在 “想象空间” 中完成任务预演、策略评估与自我迭代，将机器人在陌生场景下游任务平均成功率提升了44.7%。

2026年2月，清华陈建宇（星动纪元创始人）团队和斯坦福 Chelsea Finn（PI 创始人）团队基于 Ctrl-World (两个团队的首个合作成果），再度携手，联合提出了 VLAW 框架，首次实现了 VLA 策略与动作条件世界模型的协同迭代优化，让两者形成一个「互相促进的闭环」：

VLA 策略采集的真实交互数据，反过来用于提升世界模型的物理保真度；
世界模型生成的高质量虚拟数据，再用于持续强化VLA 策略本身。

目前，具身大脑ERA-42已在物流、制造、商业服务等多个领域落地，形成了“场景越丰富，模型越智能” 的正向循环——在物流领域，可完成药品、日化品、包裹的分拣及扫码；在制造领域，重点突破“零部件抓取 - 高精度装配 - 质量检测” 等场景任务；在商业服务领域，可完成门店客座清洁、物品递送、导游导览等。其中，部分场景效率当前达到70%。

加入ZF讨论群，请先添加小助手微信

---------END--------

我们相信认知能够跨越阶层，

致力于为年轻人提供高质量的科技和财经内容。

投稿邮箱：zfinance2023@126.com

稿件经采用可获邀进入Z Finance内部社群，优秀者将成为签约作者，00后更有机会成为Z Finance的早期共创成员。

🚀 我们正在招募新一期的实习生

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。