5亿融资背后,和余轶南、赵哲伦谈真正的机器人进家
5月1
1
日,凤凰网科技获悉,具身智能企业
维他动力
(Vbot)
在近期完成了
Pre-A轮融资
。
这笔近5亿元的融资,是消费级具身智能赛道迄今最大的一笔,由东方嘉富、华泰紫金、复星锐正联合领投,
凯辉基金
、今日资本、高瓴投资等老股东继续押注。
就在几天前,
坐在
我们面前的维他动力
创始人兼CEO余轶南,
在谈及融资的时候,并没有表现的特别兴奋
。相比钱,他更在意的是另一个变化。
就在采访前一天,首批500台Vbot“大头”超能机器狗已量产下线。5月8日,它们被发往全国各地的终端消费者手中。上海长宁来福士和北京蓝色港湾的首批直营体验店也已开业迎客。
消费级机器人开始真实进入家庭,这个时刻让人既兴奋又紧张。
创业一年多,
余轶南把这次创业比作下围棋。他的第一步棋落子极重:不做遥操、不追人形、不刷榜单。一年下来,四足机器狗大头
完成了从
定义到量产
的闭环
。第二步棋
已在悄悄布局,凤凰网科技了解到,维他动力的
人形机器人原型机
已在
推进
中
,预计8月将首次亮相。
余轶南
告诉我们
,过去一年
最大的变化
,
在于他们创造了一个新的品类,让具身智能开始走进家庭
。
更具象的变化是,越来越多从业者开始被问
——“
如果
你想做消费端,你和Vbot有什么区别?”
这是一次话语权的迁移。
以下是凤凰网科技《浪潮》与维他动力创始人兼CEO余轶南、维他动力联合创始人赵哲伦的对话详情,经编辑发布:

谈
创业这一年:第一步棋完整地走下来了
凤凰网科技:
创业到现在一年多了,
你们碰到的最大困难是什么?
余轶南:
困难挺多的。最开始我们的幻想是,做个机器人应该比造车简单。但事实上,后来发现做个机器人比造车难。
原因在于汽车体积很大,供应链、行业标准都很成熟,它是在一个已经经历了一百年的产业基础之上做Delta
(增量)
的提升、做
局部
的创新。但机器人不是,机器人几乎是从零开始。
汽车上有传感器、电池、计算平台、执行机构、电机。机器人也有——像我们的机器狗上有1
4
个电机,1
4
个自由度,有一块非常大的电池(当然跟汽车比还是小),还有大算力的计算平台和传感器。但你要把这么一大堆东西,从一辆车上那么大的体积,塞进一个这么小的身体里,这个对产品开发和工程都造成了巨大的挑战。
所以我们做了很多工作。比如关节模组,又要体积小、又要扭矩密度大、又要轻,这里面有大量的产品和工程创新。你做到这么小以后,还要在这个形态上体现非常强的运动能力,这又需要跟软件算法紧密耦合。我们不是先做硬件然后扔给软件调,而是从模型到硬件一起做迭代,最后才实现现在的表现。
凤凰网科技:
现在这个阶段,你觉得模型能力、工程能力,哪个更重要?
哪个是你们更擅长的?
余轶南:
我们在工程和模型能力上都是顶级的,产品对于模型的要求是非常苛刻的。和刷榜单相比,产品上的模型面向用户和开放的使用场景,你预先并不知道考题是什么,而刷榜单都是开卷考试。
今天行业里有一种状态,有点像20
1
2到20
1
5年的AI
1.0时代
。大家在刷各种Benchmark。你刷我刷。你说这东西代不代表技术能力?我
认为只是部分代表
。我工作最早期的时候,
做了很多这方面的工作
。你发现你刷了一圈分,其实并没有
什么
用。这些东西并不带来最终产品的价值变现。
我们的思考是,这里面存在一个路径问题,就像下棋,你一开始下在哪儿,在哪个地方做出你的主要阵地、做活,在什么地方去打入别人的阵地。这更多是个路径问题。
凤凰网科技:
那有没有可能别家觉得,这个阶段刷榜单更方便融资,或者说它有别的需求在?
余轶南:
的确
是这样子
,刷榜单更利于融资
。这就是一个选择问题
,
我们选择的是一条直接一口气干到终端
产品落地
、跟用户走在一起的路线。
即使没刷榜单,我们融资也不错。
但是
我觉得今天对这个行业的投资额还不够高。首先,中美之间的差异是巨大的,中国可能融个20亿人民币,北美可能是20亿美金。这是第一个。
第二个,你拿今天的融资额跟
其他行业
比。现在一个具身智能企业,融资最多就是三五十个亿。但电动汽车的起步是50亿,如果你没有一百亿在账上,就没法干。再往更早看,移动互联网时代,一天烧掉几个亿都正常。
这个行业还需要更多的资本加持。
凤凰网科技:
每家花钱的方式不一样。
你们
融了钱,打算怎么花?
余轶南:
当事情没有很清晰的时候,不要乱花钱。
经过一年的探索
,
技术
的确逐渐在变得清晰。特别是
数据的
技术路线现在在收敛。
我们似乎看到了一条通往终局的方案。
早期是遥操,机器人真机遥操,它最直接,但效率很低,不拟人,而且边界无法复制。你没法把人形机器人放到菜市场,每天靠一个人远程遥控去干活,这种方式不work。后来有做夹爪的,戴个手套、装个夹爪去采数据,但这种方式也不够好——夹爪本身不能通向终局。机器人的终局,大家的想象都是灵巧手
,因为灵巧手可以做人类能做的所有事情。
灵巧手怎么采数据?一直没有被解决。
最近
数据采集手套
向前推进了一步
,
但
坦率说,这个方式
仍然可能不是终局方案
。
凤凰网科技:
我们之
前听到
过
一个说法
,
很多数据采集回来,可用率只有不到5%。
另外也有人说,第三人称视角的数据可能没那么重要。
余轶南:
是的,浪费了很多钱
。
今天比较流行的
数据采集
方案是
第一人称视角。但第三人称视角也很重要
,因为从第一性原理出发,人是通过第三人称观测别人干活来学习的,然后在第一人称视角去实践
。
这两种视角
需要组合
,
我觉得技术的确在收敛。


谈
产品进化逻辑:从Model S到Model 3,从理想ONE到L9
凤凰网科技:
维他
动力
马上有大批量机器进家,这个数据可能是别人做不到的,非常关键。现在这批马上交付的C端用户量,在你们预期中吗?
余轶南:
市场的热度超过了我们的预期。
赵哲伦
:
发布成功之后,非常多公司立项做了机器狗。
凤凰网科技:
你觉得为什么他们反应这么快?突然大家都对
机器狗再次
感兴趣了
。
赵哲伦:
机器狗这个品类本来在产业里已经有很多年,也很成熟了。具身智能标准形态就两个:人形和四足。行业共识本来就是四足比人形更成熟。但大家之前一直没有找到进入消费端的那个契机。之前四足的产品定义一直差一点东西——它怎么跟人交互?它跟人是什么样的协同关系?之前没人定义清楚。所以四足在之前要么是科研教育,要么是遥控玩具。它给人的认知就是这样。
直到我们去年年底发布产品,等于完成了一轮定义。我认为行业里达成了一定的共识:按这个定义方式,四足有机会做出增量,盘子会变大,不是原来一年就小几万台的那个量。
行业头部
对四足的量
也
非常看好,认为增量就是在消费端的爆发。在这一点上,行业是有一定共识的。
凤凰网科技:
所以你们觉得维他
自己的护城河是什么?
我们看到在
人形机器人领域,荣耀突然出来就做了个机器,把前面的成绩全部覆盖了。
赵哲伦:
有三个部分。第一,和用户一起的迭代。初期的用户反馈会极大加速我们产品定义的细化。我们迭代速度非常快,团队研发能力强是一部分,但更重要的原因是真实的用户在给你反馈。这个反馈是外面没有的。友商可能在对标我们
的
产品,但你最近再来看,OTA
之后的产品
又不一样了。这些变化是用户带来的。
第二,整体的数据闭环。我们是第一个真的让用户使用具身智能产品、在生活空间里形成数据闭环的公司。过去唯一有的是Tesla的自动驾驶数据,但那是在交通环境。而小区里、园区里的生活空间环境,跟交通环境非常不同。我们四足可以率先获得这些生活空间里的数据闭环,这个数据量远超过今天靠采集方式获得的数据。
第三,组织优势。这一年多我们没有开多产品线,一百来号人完整地跑通了一整条链路的工程闭环——从最早的产品定义、设计,到硬件开发、系统开发、软件算法开发,再到供应链、生产、销售、渠道。这条链路的管理非常完整。这是今天其他大公司的一个小部门,或者其他没有专注做这件事的创业公司,很难直接具备的组织能力
凤凰网科技:
你提到的第一点,“靠用户定义产品”这
有点
像新能源车现在的状态。
赵哲伦:
更像新能源车的早期阶段。我一直觉得它像两个东西的叠加。
一个是从Model S到Model 3。Model S定义了架构,电池放哪儿、电机放哪儿、传感器放哪儿,基本上把电动车的架构定义完了。但它的缺点就是成本很高。到了Model 3,基本定义都还在,但成本低了很多,把“如无必要”的东西全砍掉了,消费者量级一下子就铺开了。怎么做到的呢?靠Model S和X的用户反馈,靠供应链的协同,从当初接近十万美金,拉到Model 3的三万五到四万美金。这一点我们很像。
另一个是理想ONE到理想L9。理想ONE已经是一款很好的产品,但收到了非常非常多的用户反馈。到了L9,增加的冰箱、后排屏幕、空气循环,全都是根据理想ONE的问题衍生出来的。所以L9的产品定义非常强,ONE还不算。
凤凰网科技:
那在“大头”上有具体的例子吗?
余轶南:
第一个,我们绝大部分的核心零部件走自研。好处是多方面的。成本控制上,我们关节能做到行业普遍成本的一半以下。品质控制上,因为全自研,所有问题都能细粒度地去捕捉,在这个迭代过程中不断优化掉。我们的失效率能做到比其他公司低一到两个数量级。第三是效率,你的开发进度不光靠自己,还依赖供应商的配合程度。我们的自研率高,整个项目的推进效率就大幅提升。一年之内产品能拿出来,如果靠买别人的方案,第一贵,第二良率低,第三配合度问题能把整个项目拖长。
软件算法方面,我们的AI团队人数不算多,我了解过一些友商的团队规模可能数倍于我们。但我们的特点是“专精尖”,每个人都背靠背做事,都是这个领域非常顶级的专家。这带来的是沟通摩擦成本极低,问题分析成本极低。所以比的不仅仅是开发速度,而是从开发、集成、测试、找到问题根因,整个迭代闭环的速度。再往下,背后是人均算力的问题。
一个公司不是看总算力,没用。有的公司总算力非常大,但摊到每个人头上没多少。真正决定AI公司效率的,是人均算力有多大。最好的方式是什么?控制人数,但是释放算力,给每个人足够多的、他能够玩得转的算力。用算力来提升效率,而不是靠堆人数。有的公司人数可能是我们十倍,光AI团队,但他的总算力还没有我们多。你想想这个差别。这就是旧时期和新时代的生产力区别。
凤凰网科技:
你
之前说过,如果机器人超越人类极限,你们就要造人形。所以现在马上要准备了?
余轶南:
我们已经开始干了
,
在搭第一个工程样机的阶段
。
这事儿一直在我们长期的战略Roadmap上。我还是用下棋来打比方:你的第一步棋,第一个阵地打得差不多了,就可以去第二个阵地开始布点、做一些布局。四足这边,某些工程师的工作已经在收尾了,我们就把一部分人力释放出来,开始做人形机器人的早期规划。
这里面包括整体的初步工业设计、结构堆叠、核心元器件的选型。因为我们在四足上积累了很多经验,对整个架构有了一些升级的思考。比如现在我们的机器狗,架构比较像螃蟹——外骨骼架构。骨骼在外面,内脏在里面被保护起来,结构上更简单。但你发现人其实不是这样的。人的骨骼在内部,外面是脂肪、肌肉和表皮。人是内骨骼,不是外骨骼。
螃蟹是外骨骼。所以对于人形机器人,我们比较倾向于做内骨骼架构。它带来很多优势:外观可以更灵活地调整,自由度更高,身体本身可以做得柔软,摸上去柔软,安全性会大大提升。但它也带来更大的技术挑战——结构强度、结构设计、结构和外观的匹配,都更难。但我觉得这就是“电动拖拉机”和“电动保时捷”的区别。
凤凰网科技:
你做出来之后,会去挑战什么吗?比如速度、运控,或者比赛?
余轶南:
没太想过这个问题。一个好的产品,应该在多个维度上不断演进。现在很多人刷榜,模型刷榜也好,运动会刷名次也好,除了出名以外好像也没别的太大用途。我不是说这没有意义——就跟汽车行业的F1、拉力赛一样,它确实推动技术进步。但我们更看重的还是内核,内核就是技术进步。表象可以是拿了第一,但我们更坚定要做的是推动技术内核往前走。
比如更小的体积里实现更大扭矩、更轻的重量,这里面涉及关节架构、电机架构、减速器的革新。比如算力密度,算力密度做大以后散热怎么做?再比如电池,今天都是集中式的一大块,像砖头一样放在胸腔里,所以很多机器人胸很大。那有没有可能做分布式的电源架构?像人的血管系统和神经系统一样,让能源全身分布,布局更加灵活动态。这些东西带来巨大的技术挑战,但如果你能做到,那一定是更先进的产品。
挑战技术的极限,是我们的核心追求。

谈
竞争壁垒:技术没有壁垒,但组织力有
凤凰网科技:
如果行业里
接下来
更多企业
对消费端
开始
感兴趣
,你怎么应对他们的竞争?
余轶南:
竞争总是存在的,你找不出没有竞争的领域。只不过看你是否比别人先进入战场。至少在今天,行业形成了一个共识:C端,特别是对四足机器人,是更大的战场。我们比
其他人
更早进入这个战场,而且在引领这个市场的产品定义话语权。现在绝大部分厂商想定义一款四足机器人
或者家用具身机器人
的时候,不可避免一定会需要跟我们来比较、来参考我们
的产品定义
。
凤凰网科技:
但是你们磕出来的那些小细节,别家如果挖一个你们的人,不就跟上了吗?
余轶南:
技术
存在不断的竞争,需要让自己持续领先,但技术本
身并没有壁垒。就像你说的,竞争对手挖一个人,就很快能Get到你在干什么。但真正做实体产品,做Physical AI这条路线的时候,壁垒是多方面的。你不可能挖走一整个团队。你可能只能单点挖某些人,单点的东西并不能构成面状的竞争能力,最多是补充一点局部能力。这种博弈一直存在。我们也会挖别人,我需要补某些方面的能力时,我也会挖。但最后所有挖来的人,都要消化到组织内部,变成组织力的提升。
最后的真正竞争力,是你的组织力的提升、你的效率的提升。你是不是能用别人十分之一的成本或者十分之一的时间,干出别人花很多年才能干出来的事。
凤凰网科技:
在这个过程中,你怎么跟投资人沟通?
他们的期待一直在变。
余轶南:
这就看你的定力了。如果你总是跟着
市场的情绪
走,公司一定会被拉得东倒西歪。你必须有自己的Roadmap和自己的定力。不是说今天火什么我就去讲什么,这样的话你也不会获得投资人的尊重。他投你的时候是风口,风口过去,他会非常焦虑,这种情绪最后会反噬你。
凤凰网科技:
在造机器人这件事上,你们的
定力和价值观
是什么?
余轶南:
第一天我们就定了一个核心原则:做面向生活空间的机器人。这是最大的原则。
往下拆解,两件事。左边,需要像精品的硬件本体。什么叫做精品的硬件?你看这桌子上全是——MacBook、iPhone、保时捷的跑车、奔驰大G。这些产品不管出货量现在怎么样,但只要做这个品类,全行业都会去对标。它定义了一个时代的产品。
右边,是AI或者软件,这更像是水。它会随着时间演进,你今天看到的跟几个月后看到的就不一样了,它升级了,变更好了。我们给机器狗设计了一整年的延展规划,从一个平台性产品,演化成面向多种场景的应用型产品,把价值越做越好。
在这两个内核之上,再构建技术
竞争力
。硬件上最重要是能源、动力、算力。算法上,是模型、AI人才、以及数据。应用上,就是刚才班长
(赵哲伦)
讲的,跟用户不断闭环,把用户声音经过分析判断,形成产品开发的Roadmap。这些事情都是不变量。
在不变量之上,我们再把它形成对外讲的投资融资故事:我过去什么样子,现在什么样子,未来什么样子,为通向未来要做哪些技术储备,开发了哪些先进技术。适当的时候我们也去适当地打一些榜,来证明自己技术的确不错。但逻辑是自下而上一层一层构建的,而不是今天市场上什么东西火、投资
领域
什么火,我们去讲什么故事。底层逻辑不一样。
凤凰网科技:
你们首批用户,有多少是
C
端消费者?有多少是行业内的人?
赵哲伦:
几乎
全都是。行业里的人最多不到10%。
凤凰网科技:
他们的画像是什么样的?
赵哲伦:
最近我们做了一个用户调研,挺有意思的。接近90%都是有孩子的家庭用户。目前的购买主导者80%以上是男性,但在线下体验店的实际观感来看,女性和妈妈们的兴趣也很浓厚,只是我们第一波传播可能更多触达到了男性。
人群定位基本是中产家庭,城市集中在GDP排名前20的城市。前六个城市——北上广深成杭——占了一半,剩下14个城市再占一半。
从公测数据看更有意思。嘴上说喜欢和真用不用,这个骗不了人,我能看到数据。一些偏自媒体、想
秀
一下的用户,不会长期用,偶尔OTA更新或觉得好玩才会用。长期使用率高的,还是家里有孩子的,而且孩子年纪集中在K12阶段,三
、
四岁到十二岁。
孩子本身很感兴趣,也确实需要陪伴。中国这一代的孩子都比较无聊,爸妈都忙,陪伴时间少。我们这个东西还真能起到一点陪伴作用。加上AI属性强,能在英语问答、百科问答上帮到孩子。第三,它还能带孩子出门,这不管是孩子喜欢还是家长需要,都能满足。
凤凰网科技:
所以它的价格还会更便宜吗?
余轶南:
基本上每年可以降10%到20%,连续五年。因为规模上去,再加上架构进一步优化。你看现在的成本大头,第一个是关节,跟规模强相关。第二是计算平台,跟芯片强相关。每一代新芯片因为集成度更高,能让成本降百分之二三十。传感器基本符合
摩尔定律
。结构件、电池都是,每年自然就会降价。这几年唯一在涨价的是内存。整体逻辑是这样:当你的量真的大、架构做到足够好,成本会无限接近物料本身的成本——铜、稀土、铝、PCB板这些原材料。
赵哲伦:
今天这一代,虽然我们卖的价格对C端不算低,但我们的成本压力其实非常大。同等价位的机器狗产品,用料比我们低很多。电池、电机、传感器、算力都低很多。
我们相当于是把过去供给高校做科研的产品开发好算法,让消费者“开箱即用”
。这是全新的品类,所以初期成本会更高。


谈
组织
创新
:招聘看学习能力,不控制算力
凤凰网科技:
这个时代大家习惯讲A
I
native组织,目前你们的
工程师
已经
都不手敲代码了
吗
?
余轶南:
我们现在已经不手敲了,基本上是全部配AI。我觉得接下来创业本身就不需要那么多人。需要铺人力的,只有那些需要频繁跟人打交道的岗位:门店、客服。在公司内部,这涉及组织形态的根本变化。
过去华为讲“把组织建在流程之上”,先把业务洞察变成流程,然后把所有人放在流程上的节点,每个人有责任、权利和义务。这样跑起来本质是跑流程。
但今天,应该叫“把组织建在AI之上”。所有人变成一个圆桌,中间是AI。所有人跟AI交互,AI帮你识别问题、分发问题。公司变成更大项目制。大家谈好分工,各自干活,通过AI提高效率。它最大的优势是大幅降低管理和交流的摩擦成本。
在
The Infinity Machine
这本书里,
DeepMind的哈萨比斯
不断强调一件事,
过去动辄上万人、十万人做项目,最大的难点是信息的传递——从上到下逐层扭曲,从下到上逐层偏差。所以你看到有些庞大项目根本干不下去,一干
几
十年
,进展非常缓慢,所有的项目管理工具都失效了
。今天把AI放在中间,靠它来Handle
信息交互
,人和人之间摩擦成本大幅降低。每个单兵的能力,深度和广度都被大大拓宽。
有人会觉得,那就需要纯专家型人才。但我不完全认可。真正的内核是那个人的学习能力。专家也是经过大量项目、成功和失败一点点成长起来的。专家的本质是他学习能力足够强,能快速迭代自己。所以招聘的标准应该是:这个人有没有旺盛的自我生长能力。如果有,三个月他就能
超越
你
的期待
。这跟年龄都没关系。
这就是我们的组织观。
凤凰网科技:
你
的
心态跟一年前刚创业时有变化吗?
余轶南:
我觉得还蛮开心的。你看今天我们做的东西被这个行业
认可
。
不
管出货多少,你事实上已经是这个赛道里领军的企业了。所有想干这件事的人——投资人去投别人,用户去买别人的——都会先问第一个问题:“你跟Vbot有什么区别?”
在我们创业之初,我写BP跟投资人讲,投资人问的全是“你跟
头部企业
有什么区别”。今天没有任何人再问我这个问题了。
反过来,现在别人问的是:“你要做消费端,你跟Vbot有什么区别?”你看,势能就转换过来了。
我觉得做企业最开心的事就是这个——你是不是能持续地引领行业。这跟你融多少钱没关系。我们后面做新
产品
也是一样,第一目标就是:做出来的一定要是引领行业的东西,而不是Another一个什么。
凤凰网科技:
这样的成功,再来几个你
会
觉得维他已经非常成功了?
余轶南:
没有终点。做企业跟冲浪一样,一浪要
高
一浪
,这是一个无限游戏
。千万不能到“这个事情已经做得差不多”的状态,变成纯粹的运营模式。四足这条线进入跟用户迭代的周期,就像小孩已经生出来,要茁壮成长。另一条线,我们就需要突破新的不可能,让新
产品
变成行业新的标杆。
凤凰网科技:
人形产品
的具体
规划
是怎么样的
?
余轶南:
8月份会亮相,年底会有相对成熟的工程形态。从工程到量产还有Gap。我最近确实感受到时间节奏很紧迫——从
一些
渠道看到的Tesla和Figure的进展,可能比公开市场上大家看到的要更提前。
凤凰网科技:
为什么那么多
机器人
公司
选择了复用成熟的
供应链,长出来
的
产品
都一样,
他们为什么没有
去
做全新产品定义的思维?
赵哲伦:
因为VC要求“快”。他们其实是Follow VC的逻辑。我也有过动摇,问过南哥,咱要不要去苏州找某个工厂,直接拿一个人形方案,稍微改个外观贴个标就出来?一两个月就能亮相。
南哥回了我两个意思:第一,太丑了。第二,跟我们价值观不符。那种东西摆样子可以,所有机械臂都是标准件,贴个壳完事儿。但这做的是科研工具,是Demo。行业里真正从设计开始,到硬件结构设计、造型、系统架构定义,这一套完整的从头做的人,事实上不多。所以大家出来的东西才会长得一样。
(来源:凤凰网科技)
