“愚公”蔚来，用基础设施移世界模型的山

发布时间：2026-07-03来源：硅星人Pro

作者｜王兆洋
微信｜Geisterspiele

任何一次“技术范式变革”都不是突然发生的。

在大众感知到技术的突破之前，那些支撑这些技术的复杂而艰辛的基础设施建设，往往已进行了数年。它们枯燥、漫长、昂贵，常常体现出天才般的预判，甚至回头看，更像是某种在当时少有人理解的赌注。

2006 年，英伟达把 CUDA 推进消费级显卡时，GPU 还主要属于游戏和图形渲染；同一年，亚马逊推出 AWS，把计算资源对外售卖时，多数公司还习惯自己买服务器、建机房；更近一些的有字节跳动，它把 A/B 测试做成公司级系统时，内容分发的竞争也还没有被充分理解为效率竞争。正是这些早期的基建，换来后来更多人感受到的技术突变。

今天，AI 也正在制造类似的时刻。

大模型、Agent、世界模型，这些新能力看起来是模型爆发，背后其实都是基础设施的集中兑现：算力、数据、工具链、工程系统、反馈闭环。谁能在需求真正爆发前几年就开始搭这些底座，谁才可能在浪潮到来时把能力真正落到产品里。

最近的一个例子是蔚来。

2026 年 6 月，蔚来向超过 70 万用户推送了最新版世界模型。

这次推送覆盖蔚来和乐道两个品牌，覆盖 NT2、NT3 等四个平台，也同时覆盖两套完全不同的芯片平台：英伟达 Orin-X 和蔚来自研的神玑 NX9031。

用户感知到的，可能只是车又 OTA 了。

但放在智能驾驶行业里，这次升级很不同。它的主角不是车机多几个功能，也不是座舱体验做几处优化，而是智能驾驶能力的一次大规模更新。更关键的是，它不只覆盖最新车型，也最早覆盖到 2022 年 3 月起交付的 ET7。

也就是说，四年前交付的老车，也进入了这次世界模型能力迭代。

这其实和智能车行业过去几年所习惯的完全不同，人们似乎已经默认，新能力往往先给新车，老车即使还能 OTA，也经常只能拿到延迟版、简化版，或者被挡在下一代能力之外。而且最早推动了 OTA 普及的特斯拉是里面最典型的参照。它曾经让行业相信，车买回家之后，能力还可以持续生长。但 FSD 继续向无监督自动驾驶演进时，硬件边界开始浮出水面。算力、内存带宽、摄像头和车端计算平台的代际差异，重新把软件拉回到硬件上。

蔚来把一套新一代智能驾驶能力推到了跨品牌、跨平台、跨芯片、跨车龄的真实用户车上。这给行业带来了新的标准，而这背后也是这家公司六年技术路线的一次集中展示。

智驾的竞争是基础设施的竞争

过去几年，智能驾驶行业总是以算法名词的方式向前推进。

BEV、OCC、无图、端到端、VLA，每出现一个新词，就像开启一轮新的技术迁移。车企需要证明自己没有掉队，供应商需要证明自己走在前面，行业也习惯用最新模型架构来判断一家公司的智驾水平。

算法当然仍然重要，而且会越来越重要。但到了今天最热的“新名词”世界模型阶段，只比较算法已经不够了。模型越大、越统一、越接近真实世界，对底层系统的依赖就越深。它需要更充分的感知输入，更适合大模型的车端芯片，更高效地部署工具链，更持续的数据闭环，更大规模的验证网络，也需要把几十万辆量产车组织起来的车端算力调度能力。

智驾下半场真正比拼的，是模型迭代的吞吐量。

一家公司能不能更快训练模型、更快部署到车端、更快验证风险、更快找回 Corner case，再把这些问题重新喂回系统里，决定了它的模型能力能不能持续增长。

蔚来高级副总裁，智能驾驶研发负责人任少卿在近期的一次工程系统沟通 workshop 里，把这套系统拆成四个部分：两个硬件，两个软件。硬件是传感器和芯片，软件是 AI Infra 和数据 Infra。前者决定车能不能看见世界、跑动模型，后者决定模型能不能上车、数据能不能回来、验证能不能闭环。

第一层，是传感器。

一辆车要理解世界，首先要看见世界。蔚来在 NT2 时代做了几个后来被反复讨论的选择：高线数激光雷达放在车顶，使用瞭望塔式布局；上 800 万像素摄像头；再往后，NT3 平台开始引入 4D 毫米波雷达。

今天回头看，这些配置已经不算新鲜。但在 2021 年 NT2 发布时，它们都是很重的决定。

激光雷达放在车顶，算法性能更好。它站得高，看得远，也不容易因为低速碰撞带来高昂维修成本。但它直接挑战整车造型和风阻。高像素摄像头意味着更高成本和更大数据处理压力。4×Orin-X 也不是简单堆芯片，而是一个复杂的 AD 域控工程。

任少卿复盘车顶激光雷达决策时说，当时内部讨论非常激烈。行业都知道要上激光雷达，但放在保险杠、座舱、车顶，每种方案都有代价。车顶方案在算法性能和维修成本上更好，却对设计和风阻提出更高要求。最后蔚来的选择是，如果判断未来五年、十年的方向是对的，即使今天有问题、有冲突，也应该去做，然后让时间证明。

这不是说车顶激光雷达就是行业唯一答案。有人坚持纯视觉，国内也有越来越多轻雷达、弱激光雷达甚至去激光雷达的方案。蔚来选择的是一种更偏工程冗余和长期兼容性的答案。

而传感器真正难的地方，还不只是“配得高”。行业发展太快，不同平台之间一定会出现差异。NT2 和 NT3 的摄像头不完全一样，因为 Orin 和神玑芯片里的 ISP 发生了变化；NT2 使用 3D 毫米波雷达，NT3 开始上 4D 毫米波雷达；蔚来和乐道车型之间，也有不同的传感器组合。

如果每个平台、每款车、每套传感器都单独开发一套模型，智驾迭代很快会变成工程灾难。

蔚来的解法是用同一个网络接入不同传感器。

不同摄像头进入同一个网络，由神经网络能力把性能拉平；激光雷达和毫米波雷达则像接口，有这个传感器，就输入对应信息，没有这个传感器，网络也能正常跑。任少卿把这种能力称为类似“热插拔”的方式。

这解释了为什么蔚来可以在四个平台、十几款车型上同时推送世界模型能力。基础设施的本质，不是每一辆车硬件完全一样，而是系统能吸收差异。

接下来的重点，是芯片。

神玑 NX9031 常被放在“自研芯片”的叙事里理解。但从世界模型角度看，它更值得讨论的地方，是蔚来在 2022 年设计这颗芯片时，对下一代智驾模型形态做了一次提前判断。那时候，行业还没有完全进入 Transformer 智驾模型时代，很多网络仍然以 CNN 为主。但在当时，蔚来内部就下了判断，下一代智能驾驶模型会越来越 Transformer 化，甚至走向纯 Transformer。

这个判断直接影响了神玑的芯片设计。

任少卿提到，同样计算量下，Transformer 对内存带宽的需求是 CNN 的 8 到 70 倍。进入大模型上车阶段，芯片瓶颈不再只是 TOPS 高不高，还包括数据能不能搬得动。他举了一个 7B 模型的例子：如果一个 7B 模型按 30Hz 运行，每赫兹解码 5 次，就需要 500GB/s 级别的内存带宽。神玑单颗芯片超过 500GB/s 的内存带宽，正是为这种模型形态准备的。这个数字让神玑的价值变得直观。它就是为了让车端大模型真的跑得动。在这类以 Transformer 为主、受内存带宽强约束的模型上，一颗神玑相当于甚至超过四颗 Orin 的实际运行表现。

智能驾驶上半场，很多人用 TOPS 讨论芯片。到了世界模型阶段，芯片竞争开始转向“模型友好度”：内存带宽、编译器、算子优化、跨芯片部署效率，都会变成更隐蔽也更关键的约束。

第三层是 AI Infra。

模型训练出来，只完成了一半。真正痛苦的部分，往往发生在上车阶段。

云端训好的模型，要跑到车端芯片上。问题是车端芯片不止一种：有 Orin，也有神玑；有蔚来，也有乐道；有 NT2，也有 NT3；不同平台上的传感器组合也不完全一样。如果每一套芯片、每一个平台、每一种传感器组合都要单独适配，模型迭代会被工程部署拖慢。越到大模型时代，这种拖慢越致命。

蔚来从 2020 年开始，就没有完整使用英伟达的软件工具链。它只用到 CUDA 层，CUDA 之上的部署框架、推理引擎、AI 编译器全部自研。直接使用英伟达全家桶，短期当然更省事。尤其在 Orin 时代，这是最自然的选择。但蔚来很早就判断，未来一定会进入多芯片平台阶段。Orin 只是一个阶段，自研芯片迟早会上车。工具链如果一开始被单一芯片绑定，后面每多一种芯片，软件系统都要被撕开一次。很多公司自研芯片真正上车时，会遇到“芯片能跑”和“软件生态能用”之间的鸿沟。蔚来提前把部署栈抽象出来，等于在 2020 年就开始为多芯片时代交学费。

而另一边，AI 编译器解决的是更具体的问题。任少卿这样描述曾经的协作状态——“算法工程师在前面改得很开心，后面一堆工程的兄弟跑断腿。”过去，一个模型架构改动，后面的工程团队要手写优化、做部署适配。用通用工具链，模型部署可能需要一到两周。蔚来自研 AI 编译器后，通过自动算子优化和图优化，把这个过程缩短到一到两天，推理效率提升 20% 以上。

后来，蔚来又把部分模型上车流程用 AI Agent 自动化。量化、集成、Pipeline、CI/CD、跨芯片误差校验、发版部署，过去需要工程师守着跑，现在全自动情况下可以压到两个小时以内。

还有一层是数据 Infra。

蔚来对数据有一个非常有启发的判断——任少卿形容，“数据的本质是算力。”

过去行业讲智能驾驶数据，常常讲车队规模、行驶里程、数据量。谁的车多，谁的数据多；谁的数据多，模型就更强。在传统理解里，数据就是文件。车跑过一段路，摄像头、毫米波雷达、激光雷达记录下来，上传到云端，存起来，就是数据。

但进入大模型阶段后，真正有价值的数据不是普通录像存量，而是某一个模型真正需要的 Corner case。一个模型在哪些场景会犯错，在哪些边界会犹豫，在哪些异常状态下回不来，这些才是训练和迭代最需要的东西。

要找到这些 Corner case，不能靠简单拷贝数据。必须让模型在真实车端、云端仿真和扰动场景里反复跑。也就是说，本质上数据是模型跑出来的，是算力筛出来的。不同模型需要的 Corner case 也不一样，这意味着数据不是可以零成本复制的通用资产。所以，数据即算力。

这也是蔚来建立群体智能系统的逻辑。

几十万辆用户车，不只是数据来源，也是一张车端算力网络。通过云端调度量产车闲置算力，蔚来可以在用户无感、不影响安全的情况下做验证、筛选和闭环。

主动安全每周验证里程超过 4000 万公里，整体每周验证里程超过 1 亿公里。这样的规模如果靠传统测试车和测试人员去跑，几乎不现实。更重要的是，验证和数据筛选在这里开始合流。新的模型在真实车辆和仿真场景里跑，暴露出问题，再把这些问题变成新的有效数据。训练、验证、数据筛选，形成一个持续滚动的闭环。

智驾后半场的规模优势，也开始转移到能把多少量产车变成安全、可控、可度量的验证节点。车多只是入口，能把车组织成有效数据和验证网络，才是真正的壁垒。

表面上，各家公司都在讲世界模型；底层真正拉开差距的，是谁能搭起一套持续生产模型能力的基础设施。世界模型不能在发布会舞台上突然长出来，它只能长在传感器、芯片、工具链、数据闭环和车端算力网络里。

六年技术路的未来赌注

蔚来这次世界模型能力升级，背后拉长看是六年的持续技术投入。今天的共识，在六年前都是赌注。

2020 年，蔚来组建非 Mobileye 芯片和非 Mobileye 算法的全栈团队，同时开始搭建自研工具链和数据闭环；2021 年，NT2 发布，车顶激光雷达、800 万像素摄像头、4×Orin-X 一起上车；2022 年 3 月，ET7 量产，Orin 平台真正落地，同一年，蔚来开始设计自研智驾芯片神玑；2024 年，神玑 Bring Up；2025 年，神玑量产；2026 年，世界模型能力跨品牌、跨平台、跨芯片推送给超过 70 万用户。

这条时间线放在今天看很顺，但每一个节点在当时都不轻松。

2021 年发布 NT2 时，1016 TOPS 是一个很抓眼的数字，也很容易被质疑。一辆量产车要不要上 4 颗 Orin-X？这么多传感器是不是过度？用户当下能不能感知到？当时外界最直接的质疑是：这些算力是不是浪费？这种质疑并不难理解。汽车公司不是实验室，硬件冗余都会变成真实成本。多一颗芯片、多一个传感器、多一套散热和布线方案，最后都会进入 BOM、车价和毛利率。

但智能车的矛盾也在这里：一代车要卖很多年、用很多年，模型却可能每一年都换一次范式。任少卿在 workshop 里说，车从硬件角度是一个“五年、十年的事情”，蔚来内部希望硬件部署能够“坚持两代以上”。四年前开始交付的 ET7，今天还能进入世界模型能力迭代，说明当年的传感器、算力和系统架构没有被新模型轻易击穿。

今天的冗余，开始变成明天的余量。

神玑也是同一种逻辑。蔚来在模型形态还没有完全变化之前，就把芯片设计押到了下一代模型真正要克服的瓶颈上。当时行业仍然习惯用 TOPS 讨论智驾芯片，但蔚来相信 Transformer 会变成主流，那么芯片竞争就不再只是算力数字，而是大模型能不能在车端高效流动、部署和运行，这些在当时看起来很重的设计，今天则刚好卡在车端大模型运行真正需要的位置上。

数据体系的预判更隐蔽。2020 年，蔚来开始搭建数据闭环和群体智能体系。当时蔚来判断，未来真正稀缺的不是原始数据规模，而是持续生产有效 Corner case 的能力。一个模型在哪些场景会犯错、在哪些边界会犹豫、在哪些异常状态下回不来，必须让模型在真实车端、云端仿真和扰动场景里反复跑，才能被找到。

所以蔚来没有只建数据仓库，而是更早开始建车端算力调度系统。几十万辆用户车不只是数据来源，也可以成为一张分布式验证网络。车多只是入口，能不能把车组织成安全、可控、可度量的验证节点，才决定车队规模能不能变成模型迭代速度。

这些判断也没有发生在一个一路顺风的公司周期里。

2021 年 ET7 发布时，蔚来还处在高端智能电动车故事最有想象力的阶段。但 2022 年到 2023 年，供应链、交付节奏、销量压力和产品切换陆续出现，外界开始质疑蔚来的投入效率。2024 年之后，乐道推出、降本增效、换电网络扩张、自研芯片量产同步推进，蔚来一边承受经营压力，一边继续把重资产、重研发、重系统的路线往前推。

顺风时做长期投入不难，难的是在销量波动、组织调整、品牌扩张、资本市场质疑和行业价格战同时存在的时候，还继续把那些短期很难解释的地基往下打。技术预判的残酷之处就在这里：判断错了就是成本，判断对了才会变成壁垒。

到 2026 年，答案开始显影。四年前交付的 ET7 能继续升级世界模型，Orin 和神玑能够同步发版，蔚来和乐道能够共享同一代能力，这些结果不是突然发生的。六年前看是成本的投入，六年后终于开始变成系统能力。

中国智驾的蔚来启示

把这条技术线拉长，再回看蔚来，会发现它常做一类选择：短期不好解释，长期才可能显影。

NOMI 是一个例子。2017 年 ES8 亮相时，一个放在中控台上、会转头、会说话、带一点情绪表达的车载 AI，很容易被看成可爱的配置，甚至是一个有些过度设计的玩具。几年之后，大模型进入座舱，车载语音助手从命令执行走向连续对话，AI 陪伴、主动服务、座舱智能体成了行业新叙事，NOMI 当年的超前感才有了新的解释。

换电也是同一种逻辑。它长期被理解成一件重事：建站、备电池、调度、运维、选址，每一项都是成本。但换电真正改变的，是车和电池的关系。它把电池从一次性绑定在车上的固定资产，变成可以被调度、升级、运营的能源资产，也让一辆车的生命周期有了更多弹性。到 2026 年，蔚来已经完成 1 亿次换电，换电站数量达到数千座。换电仍然很重，但它已经成为蔚来用户体验和车辆长期价值的一部分。

自研芯片、AI Infra、群体智能和世界模型，也可以放进这条线里理解。它们共同指向一种公司气质：蔚来经常愿意为一个远期判断先承担当下成本。它不总是选择最轻的路，也不总是选择最好讲的路。它更像是在答案还不够清楚时，先把自己认为重要的地基打下去。

这种气质有风险。重投入不天然正确，长期判断也不天然等于远见。高规格硬件会压毛利，自研芯片会拉长回报周期，换电网络会吃掉大量资本，工具链和数据系统也很难在短期变成发布会上最亮眼的功能。

所以，蔚来的技术气质不能被简单美化成“长期主义”。更准确地说，它是一种愿意为长期用户体验承担系统成本的公司风格。它的难点不在于敢花钱，而在于能不能把这些钱花成一套可以复用、可以演进、可以穿越车型周期的系统能力。

这种系统能力平时不容易被看见。在一场发布会上，用户更容易看到一个新功能、一个新模型、一次体验优化；资本市场更容易盯住销量、毛利和亏损；行业舆论也总是更喜欢追逐最新的技术名词。基础设施很少成为主角，因为它笨重、昂贵、周期长，而且只有在下一代技术浪潮来临时，才会突然显出价值。

智能驾驶此刻正是在进入这样一个时刻。

当特斯拉 FSD 在中国市场持续推进，行业参照系会被重新校准。FSD 带来的压力，不只是某几个功能体验，也不是某一次城市道路表现，而是算法、数据、工程、验证体系的一整套代际压力。中国车企面对这种压力，不能只靠单点功能追赶，也不能只靠发布会上讲更新的模型名词。

下一阶段真正的竞争，会落到底层系统上。谁能让老车继续承接新模型，谁能让多芯片平台同步发版，谁能把量产车组织成数据和验证网络，谁能把技术预判变成用户长期体验，谁才有机会在更长的周期里不被代际差距拉开。

蔚来提供的信心也在这里。它未必在每个局部战场都最轻盈，也未必每一次技术表达都最锋利。过去几年，它也承受过销量压力、价格战、资本市场质疑和投入效率争议。但这次世界模型推送至少证明了一件事：那些曾经看起来昂贵、笨重、难解释的选择，并没有停留在愿景里，而是开始回到真实用户车上。

当一家公司想得足够清楚，又有足够定力穿越周期去执行，技术才不会停在愿景里，而会在一代又一代用户车上继续生长。

在近期的 workshop 里，蔚来高级副总裁、智能驾驶研发负责⼈任少卿、智能驾驶研发产品系统负责人佘晓丽、蔚来智能驾驶研发端侧工程负责人林伟，也难得做了很深入的交流，以下为一些对话摘录，供大家更好理解蔚来的技术思考。

Q：您之前分享提到了 VLA 和世界模型的路线之争，现在竞争是不是有一个清晰的走势？

任少卿：算法有不一样的想法很正常，这才是人工智能或者 AI 时代、新技术时代有意思的点。如果大家都第一天就走上同一条路，这个世界也不会发展这么快。

从物理世界 AI 的角度来说，过去三年也是快速在发生变化的。我们从 2016 年开始做智驾，从 2016 年到 2021、2022 年，其实智驾算法、物理世界的算法是很慢的。最大的变化就是 BEV，最多再加一个 OCC。但是从 2022 年开始，整体技术又从非常确定变成非常不确定，或者说有各种各样的机会。

我们给大家发布世界模型是 2024 年，但我们是 2023 年下半年开始研发的。当时想法比较简单：第一个，模型能够有一个更好的方式去做训练，不需要再去标这么多数据，以及有的数据你标也标不出来；第二个，希望它能变成一个多模混合的方式，统一的网络。这两个可能是最核心的事情。当然从应用角度来说，也可以用在仿真里面，用在其他加速 AI 进展的方式里面。

过去三年，我们赶上了物理世界人工智能快速变化的时期。整个模型架构、训练架构和数据工程架构，其实都在一体化地发生大的变革。我们从 2023 年底开始，在内部坚决去走一些新的方向，从 2024 年开始做一些组织变革，让大家从原来流水线的状态，变成有更多创新想法、创新组织、创新机制的状态。到 2025、2026 年，我们逐渐把这些结果拿出来。

Q：最近两年行业有两种做法，一种是用新训练出来的模型筛选有效数据，去跑原来成熟模型；第二种是尽量保留新训练出来的模型架构，通过权重或裁剪做小模型。蔚来更倾向哪一种？

任少卿：我总结一下这两个方式。第一个，拿原来的数据重训一个模型；第二是拿大的模型蒸馏一个小的模型。

这两条路，在各种大模型里面一直在不断切换，有时候重新训更好，有时候蒸馏更好，跟模型大小、训练方式都有关。因为这对我们来说都是成熟的技术栈，所以我们会针对这个模型看哪一个效果更好。

对于现在我们车上的模型来说，它更偏向于蒸馏的概率更大一些。但这两个本质上，对于现在的算法体系不会有太大变化。

现在大语言模型更多是蒸馏，原因跟我们遇到的不一样，因为它没有数据，它要把数据“蒸”出来。但是我们的状态是，我们有数据，对我们来说，简单地两边都跑一下。

Q：自研大算力芯片，友商也在做，为什么是蔚来能首先在多平台落地？

林伟：我们在过去几年，尤其是 2025 年做自研芯片量产过程中，2024 年流片回来，2025 年 3 月份量产，做了大量工作。

我们也考虑到 AI Infra 层面，从 2020 年就布局，做了大量工作，尤其是推理引擎、部署框架和 AI 编译器。因为有了 2020 年起家时的一些积累，所以自研芯片上来之后，很多工程效率达到了一个程度，芯片流片回来之后，很快就做到了跨芯片兼容。

第二是这两年大模型开始出现，尤其是我们自己的世界模型走上量产之后，发现早几年布局的高带宽起到了非常重要的帮助。

Q：现在 9 系上面是两颗 9031，这两颗 9031 的工作逻辑是什么？是为了 L3 备份，还是分别跑不同模型？

任少卿：我们芯片大概是 2022 年开始设计的，那时候就知道 Orin 如果去做 L3 只有一种办法，就是把两个芯片都跑起来。L3 最终希望在毫秒级接管，如果一块芯片有问题，另外一块芯片接管，只能说这两块芯片都在运行。

但是这件事情对于算力和功耗，尤其是功耗，其实不太优。绝大多数情况下芯片没有问题，但你要在 99.9999% 的时间里面，为了那 0.0001% 的问题去耗一倍功耗。所以我们在芯片里面设计了一个温备逻辑，有一块芯片可以不完整跑起来，它不需要消耗那个功耗，但是可以备在那里。

另外，也会有伴生的一些数据筛选逻辑、验证逻辑跑在另外一块芯片上。那个芯片就干两个事情：第一是所有数据筛选验证的逻辑，第二是温备再去跑一个冗余。

Q：我们有没有对一些竞品车型进行体验，比如 FSD？对于这个版本行业位置的预期大概是怎样的？

任少卿：特斯拉确实在数据体量和训练资源上是世界领先，远远大于国内公司，不是一个量级，有可能高一个量级以上。

对我们来说，面临的问题是怎么在资源更少，尤其是算力更少的情况下，达到类似结果。

现在大家也在说延迟问题。从 350 版本，就是马上要发的 NT2 版本，我们已经开始优化延迟。我们把建模方式从轨迹变成方向盘、油门，就是在优化一定延迟。

但这还不够。原来的控制体系，从模型控制体系到真正底盘、电机有很多层，每包一层接口延时就会变高。所以我们会跟底盘同事做非常深入的打通，把底盘自研优势和智驾自研优势拼起来，最终产生一个对于智驾控制里面最小的延迟。这里面会变成主机厂独特的优势。

Q：有没有可能未来经过预训练之后的模型不再需要数据了，可以通过更强的 AGI 能力直接实现更强的自动驾驶能力？

任少卿：我想说数据才是这个时代 AI 的根。

除了算力提升之外，各种模型、端侧算力、云端算力，过去五年、十年提升了非常多，甚至百万倍提升。但是所有基础模型，包括语言模型、智驾和后面更新的模型，最根本的问题还是数据。

语言模型是一个上帝恩赐的特殊领域，因为没有任何一个 AI 应用天然躺在这么多数据在互联网上。做语言模型的时候，把互联网上的数据下载下来，简单清洗就有几十 T 甚至更高的数据。

但是其他所有应用，都需要产生数据，解决数据问题。尤其是智驾，我们今天说这么多关于数据的事，本质上都是为了解决像互联网上直接可以下载下来那些数据的问题。

互联网数据有两个点：第一是量大，第二是这些数据是十亿网民花了十年上传的数据。上传过程是一个 Corner case 过滤过程，因为上传是为了获得流量、获得关注度，所以大家天然会上传一些新奇的、更有价值的东西。

但是智驾有什么？智驾首先没有这么大的数据量，第二是哪儿来十亿网民？

所以智驾首先要解决的是产生这么大的数据量，第二是产生等价于十亿网民做筛选的能力。显然没有这么多人工干这个事，只能通过自动化去做。

只有这一类数据，就是又量大、又 Corner case 明确的数据产生之后，神经网络才能发挥作用。直到今天，越大的模型对于数据的结合性越强。所以在真实世界，在数据角度要解决的问题，也是我们今天讲的这些所有事情背后的原因。

Q：为什么我们首先要做的是一个 AI 基建，然后打通一个数据闭环，而不是直接研发一个上层算法模型？

任少卿：因为我们认为人工智能时代最关键的是算法和数据。数据比算法更底层、更稳定，算法会一代代迭代，从 BEV 到端到端到世界模型，名词不断在变，但数据体系底层不需要跟着变。所以我们从最早期就开始搭建数据闭环和群体智能体系。这些所有东西，是从第一天搭建的时候就想清楚了。只是说我们在不断完善它，不断使得它能在更多车用到，不断使得它能跨平台。但是它底层的稳定性，比算法要稳定得多。

林伟：算法在不断演进。今天我们看到的 VLA、世界模型，过两天可能数据界又有新的算法出来了，大家也会参考。但基建是不变的。基建的意义在于，有更多更新的东西，我们以最快速度和最高效率能够尽快量产，而且可以尽快跟用户见面。

点个“爱心”，再走吧

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。