智元发布GO-2基座大模型 LIBERO成功率高达98.5% - CNMO科技
【CNMO科技消息】4月9日,智元机器人正式发布新一代具身基座大模型Genie Operator-2(GO-2),作为“智元AI发布周”的第三弹,继此前相继发布数据集与仿真开发平台后,GO-2的问世旨在弥合具身智能领域长期存在的“语义-运动鸿沟”,标志着机器人从“黑盒摸索”正式迈向“知行合一”的新高度。

智元机器人
长期以来,机器人系统始终被困在一种深层割裂之中:高层语义与推理足够聪明,底层动态运动能力也已日趋成熟,但从“理解意图”到“稳定完成”之间,始终隔着一道看不见的门槛。GO-2首次在统一架构中打通从逻辑推理到精准动作执行的“最后一公里”,其核心创新在于引入“动作思维链”和“异步双系统”架构。

GO-2在行业内首创了“动作思维链”机制——模型不会直接输出控制信号,而是先生在动作空间中生成一段高层动作序列作为任务的整体规划,描述行为的方向、结构与执行路径。这一设计使机器人从“边看边做”转变为“想清楚再做”,相关成果已被CVPR 2026接收。配合异步双系统架构,慢系统以低频运行生成动作规划,快系统以高频结合视觉观测生成控制信号,确保机器人在复杂真实环境中稳定执行,有效应对传感器噪声与环境扰动。
在性能表现上,GO-2全面刷新行业SOTA。在LIBERO基准测试中,其平均成功率高达98.5%;在面向真实世界迁移的Genie Sim 3.0评测中,GO-2展现了极强的零样本跨域迁移能力,成功率达到82.9%,显著优于现有主流基座模型。依托Genie Studio开发平台,GO-2已实现“预训练+后训练+数据闭环”的规模化部署能力,支持千台级机器人协同训练,效率提升约10倍。在工业任务中实现分钟级收敛,成功率提升2—4倍,数据需求降低50%以上。
从一年前GO-1实现视觉-语言-动作统一建模让机器人学会“理解”,到如今GO-2让机器人既能“想清楚”也能“做得准”,智元正推动具身智能从实验室走向产业化落地。
版权所有,未经许可不得转载
