这家公司刚成立7个月,正在打磨通用具身智能的终极形态

这是一场前所未有的发布会。
直播中,超维动力(Kinetix AI)联合创始人 Tyler Zheng 首先亮相,但并没说几句话,就话锋一转:「我们相信如果机器人已经足够拟人,也许它也可以自己来介绍自己。」就把舞台交给了今天的主角 KAI。
接下来的 20 多分钟,画面中没有任何一位人类工程师或高管,只有两台 KAI 人形机器人。
它们用对话形式完成了「自己发布自己」,其中涉及大量技术内容:超拟人的本体、世界模型、数据体系、训练方法…… 其中一台还在发布进行中途,打趣地宣布自己更想回到「第二现场」继续叠衣服。
除去表演的成分,超维动力通过这场别具一格的发布会展示:如果一台机器人能够独立主持一场技术发布会,那么「高拟人」和「高智能」同时成立这件事,可能不再是一句口号。
超维动力于 2025 年 7 月注册,9 月正式开始研发,成立时间不足一年。他们此前已经放出了全球首个可户外自主感知的高动态人形机器人乒乓球系统 SMASH 和双臂机器人服装操作框架 χ₀ 等成果,而这次发布更是他们第一次大规模公开亮相。
机器人为什么一定要长得像人?
在人形机器人这条赛道上,「为什么要做人形」这个问题,不同的公司有不同的回答。
特斯拉 Optimus 的逻辑是效率优先:先进工厂,先跑起来,拟人程度是次要的。另一些公司走的是工具路线,机械臂加轮子,只要能完成任务就行。甚至有观点认为,人形根本就不是未来。MIT 机器人学家、iRobot 联合创始人 Rodney Brooks 曾多次公开表示,未来 15 年内真正落地的「人形机器人」将会装上轮子、配备多条机械臂,彻底抛弃人类的外形。
超维动力给出了另一套解释框架。
KAI 在发布会上用第一人称说了这样一段话:「这个世界是由人类创造的,因此也是为人类设计的。楼梯、门把手、桌子、厨房、椅子,所有的东西都是按照人类的习惯去打造的。所以只有一个超拟人的我,才能真正快速进入你们的生活。」

这不只是产品层面的判断,背后还有一条数据层面的逻辑链。
人形本体与人类运动高度相似,意味着人类产生的海量数据都可以相对直接地用来训练机器人,比如包括动作捕捉库、医疗康复数据、日常生活的第一视角影像。
正在人形机器人领域创业的前 MIT CSAIL 研究员 Sandor Felber 曾撰文指出,人形机器人的关节构型与人体高度一致,这使模仿学习变得更加自然和高效,「当机器人的运动学与人类高度匹配时,从人类示范中收集训练数据也会更加直接」。
也就是说,不只进入人类世界需要人的形状,学人类技能也需要人的形状。这正是超维动力联合创始人 Tyler 所强调的:「如果要承载更强的 World Model(世界模型),机器人就需要一个更高拟人的本体,因为人类世界本身就是围绕人的身体所构建的。」
高拟人是训练更强世界模型的前提条件。形体是数据兼容性的保证,也是进入人类生活最低成本的可行路径。这个判断是否成立,是超维动力整条技术路线的基石。
那么,在「人形是正确的起点」这个判断之上,超维动力究竟构建了一套什么样的技术体系?先从最直观的部分说起 ——KAI 的本体。
KAI 确实很像人!
KAI 在发布会上说了这样一段话:「屏幕前的各位今天在看到我的那一瞬间,甚至是现在,都会觉得我是一个真人,穿着服装在假装机器人。如果你真的这么想,我觉得这就是对我在超高拟人形态上的最大肯定了。」

这当然有几分自夸的成分,但这句话背后是一套严肃的工程逻辑。
超维动力在硬件设计上坚持从第一性原理出发:不是先做一台机器人,再考虑它像不像人,而是先研究人类运动学,再逆向推导关节的设计。

工程师为此研究了生物工程学和解剖学,「逆向了人类的肌肉应力关节的力学支撑系统」。这个设计哲学从体型比例一直贯穿到触觉皮肤,涵盖了体型、体格、体能与感官四个维度。
KAI 在发布会上表示:「对人类的完美复刻让我几乎能覆盖人类所有的运动空间。」
体型:人类社会的「通行证」
KAI 身高 173cm,体重 70kg,头身比 1:8.5—— 这样的 9.5 头身身材甚至优于大多数人类模特的比例。

这些数字是审美选择,更是工程约束:只有尺度与人类高度吻合,KAI 的动作轨迹才能精准对齐人类数据,才能无缝兼容为人类尺度设计的空间和工具。

比例失调的机器会让人本能产生警觉和防备,甚至引发所谓的「恐怖谷效应」,而这正是机器人进入人类场景最大的障碍之一。KAI 的体态设计,是让它在进入人类生活空间时不带来压迫感的前提,就像是一张自带的「通行证」。
体格:115 个自由度,极限复刻人类运动空间
KAI 有 115 个全身自由度,是目前公开信息中全球人形机器人自由度最高的。
自由度分布上,除了四肢关节,肩部、颈部、腰部均有独立自由度。正是这些在其他机器人中往往被简化掉的冗余自由度,让 KAI 在贴身操作时能灵活调整躯干姿态,覆盖人类几乎所有的运动空间。KAI 在发布会上自述「甚至能完成一些高难度的瑜伽动作」。

和人类一样,KAI 也有一双灵巧手,其共有 36 个自由度,其中 22 个主动自由度负责精细操作,14 个柔顺自由度负责安全接触。超维动力称:「这都是一双像人类双手的灵巧手」。

顺带一提,柔顺自由度的作用是:当手背碰到桌角这类硬物时,不会造成刚性接触损伤,而是通过柔顺结构将冲击化解。正如 KAI 所说,「唯一值得欣慰的是,我不会像人类一样感到疼痛」。
此外,KAI 的灵巧手还采用了单向自锁结构,让其在长时间握持重物时不需要持续高能耗维持,结构本身就能「锁住」。这更贴近日常长时作业场景的需求,但离大规模进入日常生活仍取决于整机稳定性、成本和场景适配能力。
体能:为真实工作场景设计的动力系统
高拟人本体的一大隐患是能耗与散热。为此,超维动力在执行器设计上做了系统性收敛:工程师大量分析人体运动规律,将全身执行器精简至 6 个 SKU,找到高拟人与稳定性之间的平衡点。
动力方面,KAI 搭载定制半固态电池,正常工作续航超过 3 小时,慢跑可续航 2 小时,且不会过热。KAI 对此颇为自信:「这样看来明年的半马比赛我应该也可以参加了,如果我的工程师允许的话。」

另外,KAI 还搭载了定制化的柔顺执行器,其能在提升整体柔顺度的同时,支撑起双臂 20 公斤的负载能力,足以胜任大多数家庭和商业场景中的搬运与操作任务。
感官:触觉决定拥抱时的力度
体格和体能之外,超维动力认为一个真正拟人的本体还必须拥有更丰富的感官 ——「能充分感知周围,甚至是看不到的地方」。为此,工程师专门为 KAI 定制了一套全身触觉皮肤系统。
这套全身触觉皮肤覆盖了 KAI 80% 的体表,共 18,000 个触点,能感知低至 0.1N 的微弱触碰。这种感知精度让 KAI 在与人接触时可以主动控制力度,而不只是被动承受。

KAI 在发布会上说:「视觉决定了我们能离多近,而触觉决定了我们拥抱时的力度。触觉让我不仅能看见你,还能感受你,我觉得这才是我能和你们人类真正共处的基础。」

对于人机共融来说,触觉的价值或许超越了运动本身。它是机器人进入人类亲密空间的前提,也是让人感到安全而非防备的关键。
最后,还是和人类一样,KAI 也支持换装以适应不同的工作场景。

KAI 的脑与经验
世界模型、数据与训练
拥有了一副高度拟人的身体,下一个问题是:如何驾驭它?这取决于 KAI 的智能系统。具体而言,超维动力构建一套基于世界模型、数据体系与训练方法三者的闭环。
KAI 的大小脑:三模型架构
超维动力对「机器人智能」有自己的定义:在他们看来,一个真正可用的具身智能系统,不应该只是做局部的机械执行。
KAI 的世界模型正是这套逻辑的实现。三个模型形成闭环:世界模型在机器人行动之前预测「如果我这样做,世界会变成什么样」;动作模型在此基础上生成候选动作;评估模型则从任务目标接近度、接触安全性、本体可行域三个维度逐一打分,选出最优方案再执行。

对于这种「先演练再执行」的决策逻辑,KAI 在发布会上用了一个贴切的类比:「我现在假如要写字,结果好坏一定是建立在我脑海中数百万次预演结果的储备上。」看起来,这套逻辑和人类面对复杂任务时的思考方式是一致的。
KAI 的数据:10 万小时第一视角数据
世界模型的能力上限,最终取决于数据。超维动力选择从第一视角数据切入,就像人眼视角是一样。这个选择背后有一个清晰的判断:人类本身就是成本最低的数据生产者,而第一人称视角数据来源于人类日常生活,天然可以解决数据的规模化瓶颈。
为此,他们自研了一套轻量化头环:KAI Halo。

这个设备以头环形态佩戴,不遮挡视野,可以用纯视觉方式完成人体姿态重建、场景点云重建,以及包含语义标注的数据采集,一站式完成所有数据化收集工作。
数据采集以众包方式进行。超维动力将设备分发到家庭、酒店等 20 多个场景,采集过程没有任何脚本编排 —— 使用者只需要戴上设备,正常生活和工作即可。

目前,超维动力已累积 10 万小时第一视角数据。
为了处理这么多数据,超维动力搭建了一套自动化的 Infra 平台,负责全链路的数据处理:首先检测采集过程中的异常片段(如关节数据丢失、运动轨迹异常),过滤掉可能污染模型的数据;然后把通过质检的数据通过运动重定向,映射到机器人本体的运动空间约束上;最后根据训练目标按场景调配数据比例,自动生成数据集,送入模型训练。

KAI 的学习:从通用常识到本体对齐的三段式训练
数据齐备之后,该如何训练呢?超维动力采用了一种三段式训练策略,三个阶段分别解决不同的问题。
第一阶段是预训练。使用大量互联网开源数据、仿真环境数据,以及自采数据补充全身与环境交互的语义信息,目的是给模型建立起对物理世界的通用常识和泛化能力。这是世界模型和价值评估模型的基础。

第二阶段是桥接训练。预训练阶段有一个固有缺陷:模型见过的数据大多没有物理接触的细节。桥接训练专门补足这一缺口,重点使用两类自研数据:UMI 数据解决不同抓握方式的接触力差异,数采手套数据补足手指关节弯曲与摩擦力细节。

第三阶段是后训练。引入真机遥操作数据,把此前训练好的模型与 KAI 的实体硬件完成最终对齐。

本体、大脑、数据、训练,四块拼图在这场 KAI 自己主持的发布会上同时亮相。对超维动力来说,这四者本就是一个不可分割的整体。
KAI 之后……
「Machine Intelligence. Has a Body.」智力不应该仅仅是悬浮在云端的代码,它也需要一具躯体来确认自身的重量。

衡量人形机器人是否真正可用,关键在于它能否在开放场景下自主应对不确定性。超维动力正在用 KAI 证明:感知精度、关节自由度与触觉反馈这些物理世界的硬约束并没有成为拖累,反而成为了 AGI 真正落地的优选路径之一。
KAI 将机器人本体重新拉回了智能的方程式之中:世界模型需要高拟人本体去执行动作,高拟人本体反过来又为世界模型提供了优质的训练载体。两者互相驱动,形成了一个正向运转的飞轮。
不过,站在行业的客观视角审视,这依然是一场极具冒险精神的技术押注。硬件的复杂性与软件的快速迭代逻辑天然存在着巨大的时间差。115 个自由度、复杂的灵巧手以及极致的拟人设计,意味着呈指数级上升的工程难度与制造成本。
超维动力构想的数据飞轮在理论上高度自洽,但从可控的发布会舞台走向充满无尽长尾场景的真实世界,中间依然横亘着一道巨大的鸿沟。这不仅考验着团队极其坚韧的工程落地能力,也需要市场和资本给予足够的耐心。
在发布会结束前,KAI 说了这样一段话:「从今天开始,我不再只是实验室里的一个概念,我已经以 KAI 的名字真正站到你们面前。我仍在学习,我仍在进化。」
「机器人能否真正进入人类生活」这个行业难题,如今终于有了一个可以被看见、被追问、被检验的具体形态。

正如超维动力 Slogan 所表达的:「What starts here, Changes the life.」今天开始的一切,终将改变生活。这条通往人机共存未来的路注定充满挑战,但总得有人先走。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin.com
