谷歌发布新一代机器人推理模型 仪表读取准确率达93% - CNMO科技
发布时间:2026-04-22来源:毛志超
【CNMO科技消息】4月22日,据外媒报道,谷歌DeepMind于4月14日发布了新一代机器人推理模型Gemini Robotics-ER 1.6。该模型显著提升了机器人在物理世界中的自主感知与决策能力,其最突出的进展是在工厂环境中的模拟仪表读取任务上,成功率从上一代的23%大幅提升至93%。

Gemini Robotics-ER 1.6
据CNMO了解,Gemini Robotics-ER 1.6在未使用特定优化前,其仪表读取成功率为86%,而在应用“智能体视觉”(Agentic Vision)技术后,成功率进一步提升至93%。作为对比,前代模型ER 1.5的成功率仅为23%,而通用模型Gemini 3.0 Flash的成功率为67%。

此外,该模型还增强了多视角推理能力,能够将机器人身上多个摄像头(如头顶摄像头和腕部摄像头)捕捉的不同视角,整合成一个连贯的场景来理解。在读取仪表时,模型会先放大图像观察指针和刻度,再通过指向和代码执行来估算比例与间隔,最终读出数值。

谷歌DeepMind将Gemini Robotics-ER 1.6称为迄今为止发布的最安全的机器人模型。它更好地遵循了安全策略,能够理解并遵守如“不要处理液体”、“不要举起超过20公斤的物体”等物理约束。
版权所有,未经许可不得转载
转载说明:本文系转载内容,版权归原作者及原出处所有。转载目的在于传递更多行业信息,文章观点仅代表原作者本人,与本平台立场无关。若涉及作品版权问题,请原作者或相关权利人及时与本平台联系,我们将在第一时间核实后移除相关内容。
