“愚公”蔚来,用基础设施移世界模型的山

微信|Geisterspiele
任何一次“技术范式变革”都不是突然发生的。
在大众感知到技术的突破之前,那些支撑这些技术的复杂而艰辛的基础设施建设,往往已进行了数年。它们枯燥、漫长、昂贵,常常体现出天才般的预判,甚至回头看,更像是某种在当时少有人理解的赌注。
2006 年,英伟达把 CUDA 推进消费级显卡时,GPU 还主要属于游戏和图形渲染;同一年,亚马逊推出 AWS,把计算资源对外售卖时,多数公司还习惯自己买服务器、建机房;更近一些的有字节跳动,它把 A/B 测试做成公司级系统时,内容分发的竞争也还没有被充分理解为效率竞争。正是这些早期的基建,换来后来更多人感受到的技术突变。
今天,AI 也正在制造类似的时刻。
大模型、Agent、世界模型,这些新能力看起来是模型爆发,背后其实都是基础设施的集中兑现:算力、数据、工具链、工程系统、反馈闭环。谁能在需求真正爆发前几年就开始搭这些底座,谁才可能在浪潮到来时把能力真正落到产品里。
最近的一个例子是蔚来。
2026 年 6 月,蔚来向超过 70 万用户推送了最新版世界模型。
这次推送覆盖蔚来和乐道两个品牌,覆盖 NT2、NT3 等四个平台,也同时覆盖两套完全不同的芯片平台:英伟达 Orin-X 和蔚来自研的神玑 NX9031。

用户感知到的,可能只是车又 OTA 了。
但放在智能驾驶行业里,这次升级很不同。它的主角不是车机多几个功能,也不是座舱体验做几处优化,而是智能驾驶能力的一次大规模更新。更关键的是,它不只覆盖最新车型,也最早覆盖到 2022 年 3 月起交付的 ET7。
也就是说,四年前交付的老车,也进入了这次世界模型能力迭代。
这其实和智能车行业过去几年所习惯的完全不同,人们似乎已经默认,新能力往往先给新车,老车即使还能 OTA,也经常只能拿到延迟版、简化版,或者被挡在下一代能力之外。而且最早推动了 OTA 普及的特斯拉是里面最典型的参照。它曾经让行业相信,车买回家之后,能力还可以持续生长。但 FSD 继续向无监督自动驾驶演进时,硬件边界开始浮出水面。算力、内存带宽、摄像头和车端计算平台的代际差异,重新把软件拉回到硬件上。
蔚来把一套新一代智能驾驶能力推到了跨品牌、跨平台、跨芯片、跨车龄的真实用户车上。这给行业带来了新的标准,而这背后也是这家公司六年技术路线的一次集中展示。
智驾的竞争是基础设施的竞争
过去几年,智能驾驶行业总是以算法名词的方式向前推进。
BEV、OCC、无图、端到端、VLA,每出现一个新词,就像开启一轮新的技术迁移。车企需要证明自己没有掉队,供应商需要证明自己走在前面,行业也习惯用最新模型架构来判断一家公司的智驾水平。
算法当然仍然重要,而且会越来越重要。但到了今天最热的“新名词”世界模型阶段,只比较算法已经不够了。模型越大、越统一、越接近真实世界,对底层系统的依赖就越深。它需要更充分的感知输入,更适合大模型的车端芯片,更高效地部署工具链,更持续的数据闭环,更大规模的验证网络,也需要把几十万辆量产车组织起来的车端算力调度能力。
智驾下半场真正比拼的,是模型迭代的吞吐量。
一家公司能不能更快训练模型、更快部署到车端、更快验证风险、更快找回 Corner case,再把这些问题重新喂回系统里,决定了它的模型能力能不能持续增长。
蔚来高级副总裁,智能驾驶研发负责人任少卿在近期的一次工程系统沟通 workshop 里,把这套系统拆成四个部分:两个硬件,两个软件。硬件是传感器和芯片,软件是 AI Infra 和数据 Infra。前者决定车能不能看见世界、跑动模型,后者决定模型能不能上车、数据能不能回来、验证能不能闭环。
第一层,是传感器。
一辆车要理解世界,首先要看见世界。蔚来在 NT2 时代做了几个后来被反复讨论的选择:高线数激光雷达放在车顶,使用瞭望塔式布局;上 800 万像素摄像头;再往后,NT3 平台开始引入 4D 毫米波雷达。

今天回头看,这些配置已经不算新鲜。但在 2021 年 NT2 发布时,它们都是很重的决定。
激光雷达放在车顶,算法性能更好。它站得高,看得远,也不容易因为低速碰撞带来高昂维修成本。但它直接挑战整车造型和风阻。高像素摄像头意味着更高成本和更大数据处理压力。4×Orin-X 也不是简单堆芯片,而是一个复杂的 AD 域控工程。

任少卿复盘车顶激光雷达决策时说,当时内部讨论非常激烈。行业都知道要上激光雷达,但放在保险杠、座舱、车顶,每种方案都有代价。车顶方案在算法性能和维修成本上更好,却对设计和风阻提出更高要求。最后蔚来的选择是,如果判断未来五年、十年的方向是对的,即使今天有问题、有冲突,也应该去做,然后让时间证明。
这不是说车顶激光雷达就是行业唯一答案。有人坚持纯视觉,国内也有越来越多轻雷达、弱激光雷达甚至去激光雷达的方案。蔚来选择的是一种更偏工程冗余和长期兼容性的答案。
而传感器真正难的地方,还不只是“配得高”。行业发展太快,不同平台之间一定会出现差异。NT2 和 NT3 的摄像头不完全一样,因为 Orin 和神玑芯片里的 ISP 发生了变化;NT2 使用 3D 毫米波雷达,NT3 开始上 4D 毫米波雷达;蔚来和乐道车型之间,也有不同的传感器组合。
如果每个平台、每款车、每套传感器都单独开发一套模型,智驾迭代很快会变成工程灾难。
蔚来的解法是用同一个网络接入不同传感器。
不同摄像头进入同一个网络,由神经网络能力把性能拉平;激光雷达和毫米波雷达则像接口,有这个传感器,就输入对应信息,没有这个传感器,网络也能正常跑。任少卿把这种能力称为类似“热插拔”的方式。
这解释了为什么蔚来可以在四个平台、十几款车型上同时推送世界模型能力。基础设施的本质,不是每一辆车硬件完全一样,而是系统能吸收差异。
接下来的重点,是芯片。
神玑 NX9031 常被放在“自研芯片”的叙事里理解。但从世界模型角度看,它更值得讨论的地方,是蔚来在 2022 年设计这颗芯片时,对下一代智驾模型形态做了一次提前判断。那时候,行业还没有完全进入 Transformer 智驾模型时代,很多网络仍然以 CNN 为主。但在当时,蔚来内部就下了判断,下一代智能驾驶模型会越来越 Transformer 化,甚至走向纯 Transformer。
这个判断直接影响了神玑的芯片设计。
任少卿提到,同样计算量下,Transformer 对内存带宽的需求是 CNN 的 8 到 70 倍。进入大模型上车阶段,芯片瓶颈不再只是 TOPS 高不高,还包括数据能不能搬得动。他举了一个 7B 模型的例子:如果一个 7B 模型按 30Hz 运行,每赫兹解码 5 次,就需要 500GB/s 级别的内存带宽。神玑单颗芯片超过 500GB/s 的内存带宽,正是为这种模型形态准备的。这个数字让神玑的价值变得直观。它就是为了让车端大模型真的跑得动。在这类以 Transformer 为主、受内存带宽强约束的模型上,一颗神玑相当于甚至超过四颗 Orin 的实际运行表现。
智能驾驶上半场,很多人用 TOPS 讨论芯片。到了世界模型阶段,芯片竞争开始转向“模型友好度”:内存带宽、编译器、算子优化、跨芯片部署效率,都会变成更隐蔽也更关键的约束。
第三层是 AI Infra。
模型训练出来,只完成了一半。真正痛苦的部分,往往发生在上车阶段。
云端训好的模型,要跑到车端芯片上。问题是车端芯片不止一种:有 Orin,也有神玑;有蔚来,也有乐道;有 NT2,也有 NT3;不同平台上的传感器组合也不完全一样。如果每一套芯片、每一个平台、每一种传感器组合都要单独适配,模型迭代会被工程部署拖慢。越到大模型时代,这种拖慢越致命。

蔚来从 2020 年开始,就没有完整使用英伟达的软件工具链。它只用到 CUDA 层,CUDA 之上的部署框架、推理引擎、AI 编译器全部自研。直接使用英伟达全家桶,短期当然更省事。尤其在 Orin 时代,这是最自然的选择。但蔚来很早就判断,未来一定会进入多芯片平台阶段。Orin 只是一个阶段,自研芯片迟早会上车。工具链如果一开始被单一芯片绑定,后面每多一种芯片,软件系统都要被撕开一次。很多公司自研芯片真正上车时,会遇到“芯片能跑”和“软件生态能用”之间的鸿沟。蔚来提前把部署栈抽象出来,等于在 2020 年就开始为多芯片时代交学费。
而另一边,AI 编译器解决的是更具体的问题。任少卿这样描述曾经的协作状态——“算法工程师在前面改得很开心,后面一堆工程的兄弟跑断腿。”过去,一个模型架构改动,后面的工程团队要手写优化、做部署适配。用通用工具链,模型部署可能需要一到两周。蔚来自研 AI 编译器后,通过自动算子优化和图优化,把这个过程缩短到一到两天,推理效率提升 20% 以上。
后来,蔚来又把部分模型上车流程用 AI Agent 自动化。量化、集成、Pipeline、CI/CD、跨芯片误差校验、发版部署,过去需要工程师守着跑,现在全自动情况下可以压到两个小时以内。
还有一层是数据 Infra。
蔚来对数据有一个非常有启发的判断——任少卿形容,“数据的本质是算力。”
过去行业讲智能驾驶数据,常常讲车队规模、行驶里程、数据量。谁的车多,谁的数据多;谁的数据多,模型就更强。在传统理解里,数据就是文件。车跑过一段路,摄像头、毫米波雷达、激光雷达记录下来,上传到云端,存起来,就是数据。
但进入大模型阶段后,真正有价值的数据不是普通录像存量,而是某一个模型真正需要的 Corner case。一个模型在哪些场景会犯错,在哪些边界会犹豫,在哪些异常状态下回不来,这些才是训练和迭代最需要的东西。
要找到这些 Corner case,不能靠简单拷贝数据。必须让模型在真实车端、云端仿真和扰动场景里反复跑。也就是说,本质上数据是模型跑出来的,是算力筛出来的。不同模型需要的 Corner case 也不一样,这意味着数据不是可以零成本复制的通用资产。所以,数据即算力。
这也是蔚来建立群体智能系统的逻辑。
几十万辆用户车,不只是数据来源,也是一张车端算力网络。通过云端调度量产车闲置算力,蔚来可以在用户无感、不影响安全的情况下做验证、筛选和闭环。
主动安全每周验证里程超过 4000 万公里,整体每周验证里程超过 1 亿公里。这样的规模如果靠传统测试车和测试人员去跑,几乎不现实。更重要的是,验证和数据筛选在这里开始合流。新的模型在真实车辆和仿真场景里跑,暴露出问题,再把这些问题变成新的有效数据。训练、验证、数据筛选,形成一个持续滚动的闭环。
智驾后半场的规模优势,也开始转移到能把多少量产车变成安全、可控、可度量的验证节点。车多只是入口,能把车组织成有效数据和验证网络,才是真正的壁垒。
表面上,各家公司都在讲世界模型;底层真正拉开差距的,是谁能搭起一套持续生产模型能力的基础设施。世界模型不能在发布会舞台上突然长出来,它只能长在传感器、芯片、工具链、数据闭环和车端算力网络里。
六年技术路的未来赌注
蔚来这次世界模型能力升级,背后拉长看是六年的持续技术投入。今天的共识,在六年前都是赌注。
2020 年,蔚来组建非 Mobileye 芯片和非 Mobileye 算法的全栈团队,同时开始搭建自研工具链和数据闭环;2021 年,NT2 发布,车顶激光雷达、800 万像素摄像头、4×Orin-X 一起上车;2022 年 3 月,ET7 量产,Orin 平台真正落地,同一年,蔚来开始设计自研智驾芯片神玑;2024 年,神玑 Bring Up;2025 年,神玑量产;2026 年,世界模型能力跨品牌、跨平台、跨芯片推送给超过 70 万用户。
这条时间线放在今天看很顺,但每一个节点在当时都不轻松。
2021 年发布 NT2 时,1016 TOPS 是一个很抓眼的数字,也很容易被质疑。一辆量产车要不要上 4 颗 Orin-X?这么多传感器是不是过度?用户当下能不能感知到?当时外界最直接的质疑是:这些算力是不是浪费?这种质疑并不难理解。汽车公司不是实验室,硬件冗余都会变成真实成本。多一颗芯片、多一个传感器、多一套散热和布线方案,最后都会进入 BOM、车价和毛利率。
但智能车的矛盾也在这里:一代车要卖很多年、用很多年,模型却可能每一年都换一次范式。任少卿在 workshop 里说,车从硬件角度是一个“五年、十年的事情”,蔚来内部希望硬件部署能够“坚持两代以上”。四年前开始交付的 ET7,今天还能进入世界模型能力迭代,说明当年的传感器、算力和系统架构没有被新模型轻易击穿。
今天的冗余,开始变成明天的余量。

神玑也是同一种逻辑。蔚来在模型形态还没有完全变化之前,就把芯片设计押到了下一代模型真正要克服的瓶颈上。当时行业仍然习惯用 TOPS 讨论智驾芯片,但蔚来相信 Transformer 会变成主流,那么芯片竞争就不再只是算力数字,而是大模型能不能在车端高效流动、部署和运行,这些在当时看起来很重的设计,今天则刚好卡在车端大模型运行真正需要的位置上。
数据体系的预判更隐蔽。2020 年,蔚来开始搭建数据闭环和群体智能体系。当时蔚来判断,未来真正稀缺的不是原始数据规模,而是持续生产有效 Corner case 的能力。一个模型在哪些场景会犯错、在哪些边界会犹豫、在哪些异常状态下回不来,必须让模型在真实车端、云端仿真和扰动场景里反复跑,才能被找到。
所以蔚来没有只建数据仓库,而是更早开始建车端算力调度系统。几十万辆用户车不只是数据来源,也可以成为一张分布式验证网络。车多只是入口,能不能把车组织成安全、可控、可度量的验证节点,才决定车队规模能不能变成模型迭代速度。
这些判断也没有发生在一个一路顺风的公司周期里。
2021 年 ET7 发布时,蔚来还处在高端智能电动车故事最有想象力的阶段。但 2022 年到 2023 年,供应链、交付节奏、销量压力和产品切换陆续出现,外界开始质疑蔚来的投入效率。2024 年之后,乐道推出、降本增效、换电网络扩张、自研芯片量产同步推进,蔚来一边承受经营压力,一边继续把重资产、重研发、重系统的路线往前推。
顺风时做长期投入不难,难的是在销量波动、组织调整、品牌扩张、资本市场质疑和行业价格战同时存在的时候,还继续把那些短期很难解释的地基往下打。技术预判的残酷之处就在这里:判断错了就是成本,判断对了才会变成壁垒。
到 2026 年,答案开始显影。四年前交付的 ET7 能继续升级世界模型,Orin 和神玑能够同步发版,蔚来和乐道能够共享同一代能力,这些结果不是突然发生的。六年前看是成本的投入,六年后终于开始变成系统能力。
中国智驾的蔚来启示
把这条技术线拉长,再回看蔚来,会发现它常做一类选择:短期不好解释,长期才可能显影。
NOMI 是一个例子。2017 年 ES8 亮相时,一个放在中控台上、会转头、会说话、带一点情绪表达的车载 AI,很容易被看成可爱的配置,甚至是一个有些过度设计的玩具。几年之后,大模型进入座舱,车载语音助手从命令执行走向连续对话,AI 陪伴、主动服务、座舱智能体成了行业新叙事,NOMI 当年的超前感才有了新的解释。
换电也是同一种逻辑。它长期被理解成一件重事:建站、备电池、调度、运维、选址,每一项都是成本。但换电真正改变的,是车和电池的关系。它把电池从一次性绑定在车上的固定资产,变成可以被调度、升级、运营的能源资产,也让一辆车的生命周期有了更多弹性。到 2026 年,蔚来已经完成 1 亿次换电,换电站数量达到数千座。换电仍然很重,但它已经成为蔚来用户体验和车辆长期价值的一部分。
自研芯片、AI Infra、群体智能和世界模型,也可以放进这条线里理解。它们共同指向一种公司气质:蔚来经常愿意为一个远期判断先承担当下成本。它不总是选择最轻的路,也不总是选择最好讲的路。它更像是在答案还不够清楚时,先把自己认为重要的地基打下去。
这种气质有风险。重投入不天然正确,长期判断也不天然等于远见。高规格硬件会压毛利,自研芯片会拉长回报周期,换电网络会吃掉大量资本,工具链和数据系统也很难在短期变成发布会上最亮眼的功能。
所以,蔚来的技术气质不能被简单美化成“长期主义”。更准确地说,它是一种愿意为长期用户体验承担系统成本的公司风格。它的难点不在于敢花钱,而在于能不能把这些钱花成一套可以复用、可以演进、可以穿越车型周期的系统能力。
这种系统能力平时不容易被看见。在一场发布会上,用户更容易看到一个新功能、一个新模型、一次体验优化;资本市场更容易盯住销量、毛利和亏损;行业舆论也总是更喜欢追逐最新的技术名词。基础设施很少成为主角,因为它笨重、昂贵、周期长,而且只有在下一代技术浪潮来临时,才会突然显出价值。
智能驾驶此刻正是在进入这样一个时刻。
当特斯拉 FSD 在中国市场持续推进,行业参照系会被重新校准。FSD 带来的压力,不只是某几个功能体验,也不是某一次城市道路表现,而是算法、数据、工程、验证体系的一整套代际压力。中国车企面对这种压力,不能只靠单点功能追赶,也不能只靠发布会上讲更新的模型名词。
下一阶段真正的竞争,会落到底层系统上。谁能让老车继续承接新模型,谁能让多芯片平台同步发版,谁能把量产车组织成数据和验证网络,谁能把技术预判变成用户长期体验,谁才有机会在更长的周期里不被代际差距拉开。
蔚来提供的信心也在这里。它未必在每个局部战场都最轻盈,也未必每一次技术表达都最锋利。过去几年,它也承受过销量压力、价格战、资本市场质疑和投入效率争议。但这次世界模型推送至少证明了一件事:那些曾经看起来昂贵、笨重、难解释的选择,并没有停留在愿景里,而是开始回到真实用户车上。
当一家公司想得足够清楚,又有足够定力穿越周期去执行,技术才不会停在愿景里,而会在一代又一代用户车上继续生长。
在近期的 workshop 里,蔚来高级副总裁、智能驾驶研发负责⼈任少卿、 智能驾驶研发产品系统负责人佘晓丽、蔚来智能驾驶研发端侧工程负责人林伟,也难得做了很深入的交流,以下为一些对话摘录,供大家更好理解蔚来的技术思考。

Q:您之前分享提到了 VLA 和世界模型的路线之争,现在竞争是不是有一个清晰的走势?
任少卿:算法有不一样的想法很正常,这才是人工智能或者 AI 时代、新技术时代有意思的点。如果大家都第一天就走上同一条路,这个世界也不会发展这么快。
从物理世界 AI 的角度来说,过去三年也是快速在发生变化的。我们从 2016 年开始做智驾,从 2016 年到 2021、2022 年,其实智驾算法、物理世界的算法是很慢的。最大的变化就是 BEV,最多再加一个 OCC。但是从 2022 年开始,整体技术又从非常确定变成非常不确定,或者说有各种各样的机会。
我们给大家发布世界模型是 2024 年,但我们是 2023 年下半年开始研发的。当时想法比较简单:第一个,模型能够有一个更好的方式去做训练,不需要再去标这么多数据,以及有的数据你标也标不出来;第二个,希望它能变成一个多模混合的方式,统一的网络。这两个可能是最核心的事情。当然从应用角度来说,也可以用在仿真里面,用在其他加速 AI 进展的方式里面。
过去三年,我们赶上了物理世界人工智能快速变化的时期。整个模型架构、训练架构和数据工程架构,其实都在一体化地发生大的变革。我们从 2023 年底开始,在内部坚决去走一些新的方向,从 2024 年开始做一些组织变革,让大家从原来流水线的状态,变成有更多创新想法、创新组织、创新机制的状态。到 2025、2026 年,我们逐渐把这些结果拿出来。
Q:最近两年行业有两种做法,一种是用新训练出来的模型筛选有效数据,去跑原来成熟模型;第二种是尽量保留新训练出来的模型架构,通过权重或裁剪做小模型。蔚来更倾向哪一种?
任少卿:我总结一下这两个方式。第一个,拿原来的数据重训一个模型;第二是拿大的模型蒸馏一个小的模型。
这两条路,在各种大模型里面一直在不断切换,有时候重新训更好,有时候蒸馏更好,跟模型大小、训练方式都有关。因为这对我们来说都是成熟的技术栈,所以我们会针对这个模型看哪一个效果更好。
对于现在我们车上的模型来说,它更偏向于蒸馏的概率更大一些。但这两个本质上,对于现在的算法体系不会有太大变化。
现在大语言模型更多是蒸馏,原因跟我们遇到的不一样,因为它没有数据,它要把数据“蒸”出来。但是我们的状态是,我们有数据,对我们来说,简单地两边都跑一下。
Q:自研大算力芯片,友商也在做,为什么是蔚来能首先在多平台落地?
林伟:我们在过去几年,尤其是 2025 年做自研芯片量产过程中,2024 年流片回来,2025 年 3 月份量产,做了大量工作。
我们也考虑到 AI Infra 层面,从 2020 年就布局,做了大量工作,尤其是推理引擎、部署框架和 AI 编译器。因为有了 2020 年起家时的一些积累,所以自研芯片上来之后,很多工程效率达到了一个程度,芯片流片回来之后,很快就做到了跨芯片兼容。
第二是这两年大模型开始出现,尤其是我们自己的世界模型走上量产之后,发现早几年布局的高带宽起到了非常重要的帮助。
Q:现在 9 系上面是两颗 9031,这两颗 9031 的工作逻辑是什么?是为了 L3 备份,还是分别跑不同模型?
任少卿:我们芯片大概是 2022 年开始设计的,那时候就知道 Orin 如果去做 L3 只有一种办法,就是把两个芯片都跑起来。L3 最终希望在毫秒级接管,如果一块芯片有问题,另外一块芯片接管,只能说这两块芯片都在运行。
但是这件事情对于算力和功耗,尤其是功耗,其实不太优。绝大多数情况下芯片没有问题,但你要在 99.9999% 的时间里面,为了那 0.0001% 的问题去耗一倍功耗。所以我们在芯片里面设计了一个温备逻辑,有一块芯片可以不完整跑起来,它不需要消耗那个功耗,但是可以备在那里。
另外,也会有伴生的一些数据筛选逻辑、验证逻辑跑在另外一块芯片上。那个芯片就干两个事情:第一是所有数据筛选验证的逻辑,第二是温备再去跑一个冗余。
Q:我们有没有对一些竞品车型进行体验,比如 FSD?对于这个版本行业位置的预期大概是怎样的?
任少卿:特斯拉确实在数据体量和训练资源上是世界领先,远远大于国内公司,不是一个量级,有可能高一个量级以上。
对我们来说,面临的问题是怎么在资源更少,尤其是算力更少的情况下,达到类似结果。
现在大家也在说延迟问题。从 350 版本,就是马上要发的 NT2 版本,我们已经开始优化延迟。我们把建模方式从轨迹变成方向盘、油门,就是在优化一定延迟。
但这还不够。原来的控制体系,从模型控制体系到真正底盘、电机有很多层,每包一层接口延时就会变高。所以我们会跟底盘同事做非常深入的打通,把底盘自研优势和智驾自研优势拼起来,最终产生一个对于智驾控制里面最小的延迟。这里面会变成主机厂独特的优势。
Q:有没有可能未来经过预训练之后的模型不再需要数据了,可以通过更强的 AGI 能力直接实现更强的自动驾驶能力?
任少卿:我想说数据才是这个时代 AI 的根。
除了算力提升之外,各种模型、端侧算力、云端算力,过去五年、十年提升了非常多,甚至百万倍提升。但是所有基础模型,包括语言模型、智驾和后面更新的模型,最根本的问题还是数据。
语言模型是一个上帝恩赐的特殊领域,因为没有任何一个 AI 应用天然躺在这么多数据在互联网上。做语言模型的时候,把互联网上的数据下载下来,简单清洗就有几十 T 甚至更高的数据。
但是其他所有应用,都需要产生数据,解决数据问题。尤其是智驾,我们今天说这么多关于数据的事,本质上都是为了解决像互联网上直接可以下载下来那些数据的问题。
互联网数据有两个点:第一是量大,第二是这些数据是十亿网民花了十年上传的数据。上传过程是一个 Corner case 过滤过程,因为上传是为了获得流量、获得关注度,所以大家天然会上传一些新奇的、更有价值的东西。
但是智驾有什么?智驾首先没有这么大的数据量,第二是哪儿来十亿网民?
所以智驾首先要解决的是产生这么大的数据量,第二是产生等价于十亿网民做筛选的能力。显然没有这么多人工干这个事,只能通过自动化去做。
只有这一类数据,就是又量大、又 Corner case 明确的数据产生之后,神经网络才能发挥作用。直到今天,越大的模型对于数据的结合性越强。所以在真实世界,在数据角度要解决的问题,也是我们今天讲的这些所有事情背后的原因。
Q:为什么我们首先要做的是一个 AI 基建,然后打通一个数据闭环,而不是直接研发一个上层算法模型?
任少卿:因为我们认为人工智能时代最关键的是算法和数据。数据比算法更底层、更稳定,算法会一代代迭代,从 BEV 到端到端到世界模型,名词不断在变,但数据体系底层不需要跟着变。所以我们从最早期就开始搭建数据闭环和群体智能体系。这些所有东西,是从第一天搭建的时候就想清楚了。只是说我们在不断完善它,不断使得它能在更多车用到,不断使得它能跨平台。但是它底层的稳定性,比算法要稳定得多。
林伟:算法在不断演进。今天我们看到的 VLA、世界模型,过两天可能数据界又有新的算法出来了,大家也会参考。但基建是不变的。基建的意义在于,有更多更新的东西,我们以最快速度和最高效率能够尽快量产,而且可以尽快跟用户见面。





