黄仁勋GTC演讲,我们梳理了的四个关键问题
作者:丁玲玲
这两年AI行业,不管是大模型,还是建数据中心,到最后总会绕不开一个最实在的问题:真金白银砸进去的算力,怎么变成稳定的营收?
前两年行业狂热的时候,几乎没人问这个问题。大家都在卷参数、抢GPU、拼训练集群的规模,好像只要手里有算力、有大模型,就拿到了AI时代的船票。
但到了2026年,潮水慢慢退了:大模型的能力边界大家心里都有数了,训练的一次性投入早就花完了,真正烧钱、也真正决定生死的,是每天都在跑的推理;堆起来的算力很多时候在空转,单Token的成本下不来,商业化就永远落不了地;智能体最火,但也只是很有限地落到企业业务里。
整个AI行业,就这么走到了一个关键的十字路口。
黄仁勋在2026年GTC上的这场演讲,信息量极大。但如果抛开那些眼花缭乱的技术名词和性能数字,你会发现其实只讲了三件事:
英伟达正在从一个卖硬件的公司,变成一个卖AI工厂的公司;AI的算力需求正在从训练转向推理,而且这个拐点才刚刚开始;以及,英伟达想用OpenClaw这样的开源项目,定义下一代智能体的操作系统。
很多人看这场发布会,盯着的是VeraRubin架构又涨了多少算力,收购Groq又搞了什么新技术,但在我看来,值得关注的是当下AI行业最核心的四个命题:
第一,AI公司的核心壁垒到底是什么?第二,推理时代的竞争本质是什么?第三,AI的商业化到底该怎么走?第四,未来的AI行业,话语权到底在谁手里?
这篇文章,只想站在一个行业观察者的角度,跟大家聊聊这场演讲背后,AI行业已经发生的底层变化。
从GPU到AI工厂:英伟达的“五层蛋糕”
黄仁勋开场就把AI生态比作一个“五层蛋糕”:基础设施、芯片、平台、模型、应用。英伟达想做的是,每一层都有它的身影。
过去几年,我们已经习惯了英伟达在AI训练市场的一骑绝尘。但这次演讲最核心的信息是,英伟达不再把自己定位成一家芯片公司,甚至不是一家硬件公司,而是一家“AI工厂”的构建者。
什么叫AI工厂?黄仁勋给出的画面是:你把电力和数据输进去,它输出的是Token——也就是AI能够理解和生成的基本单位。而Token,在他看来,正在变成一种新的“大宗商品”,未来会像石油一样被定价、被交易。
为了实现这个愿景,英伟达正在做两件事:垂直整合,但横向开放。
垂直整合很好理解。从CUDA库到NVLink交换机,从自研CPUVera到收购Groq,再到共封装光学技术,英伟达把数据中心里能想到的所有组件都自己做了一遍。
为什么要这么做?因为加速计算不是简单的“芯片更快”,而是要从算法到底层系统做协同设计。老黄的原话是:“我们别无选择,必须深入理解应用、领域和算法的底层逻辑。”
但有趣的是,英伟达同时强调自己是“横向开放”的。它的库、框架、模型都愿意和云厂商、企业软件、开源社区集成。
你看,AWS、Azure、GoogleCloud都被请到台上,Snapchat、Salesforce、Palantir也成了案例。英伟达很清楚,它不可能通吃所有应用层,最好的姿态是成为“赋能者”。
这种“既要又要”的姿态,其实是很多平台型公司的标准话术。但英伟达的特殊之处在于,它确实拥有足够深的护城河,CUDA的装机量、开发者生态、以及每年数千亿美元的客户采购承诺。这些让它在谈判桌上有了足够的筹码。
推理的拐点:算力需求暴涨10000倍
黄仁勋反复强调一个数字:过去两年,AI的计算需求增长了10000倍。他解释说,这是因为AI的能力从“感知”进化到了“生成”,又从“生成”进化到了“推理”。
什么意思?早期的AI是识别图片里的猫,现在的AI能自己画一只猫;而未来的AI(比如o1、o3模型)会自己思考怎么画一只更好的猫,甚至反思刚才画得对不对。
这个过程需要模型在生成Token之前,先产生大量的“思考Token”,也就是内部推理。这会让计算量再上一个数量级。
老黄甚至给出了一个更惊人的预测:到2027年,客户对Blackwell和Rubin架构的采购订单总额将达到1万亿美元。
考虑到英伟达2025财年的营收刚刚达到千亿,这个数字听起来像天方夜谭。但他的逻辑是:每一家云服务商、每一家AI公司,本质上都在运营一个“Token工厂”,而Token的产量直接决定了收入。
在功率受限的数据中心里,谁能用更少的电产出更多的Token,谁就能赢。
从这个角度看,英伟达发布的硬件路线图就很容易理解了。
Blackwell相比Hopper,每瓦性能提升了35倍;VeraRubin又在高端层级提升了10倍;再加上收购Groq后引入的数据流处理器,用来处理那些需要极低延迟的解码任务。英伟达试图用多层次的架构,覆盖从免费API到天价企业服务的所有定价区间。
但这里有一个值得玩味的地方:性能提升的曲线正在变得越来越陡峭。
从2016年的DGX-1到2026年的VeraRubin,十年间算力提升了4000万倍。这个数字本身已经脱离了普通人的感知范畴。问题是,这种指数级增长还能持续多久?物理极限、能源消耗、制造成本,都是现实存在的天花板。
黄仁勋的答案是“极致协同设计”。把芯片、互联、散热、软件全都揉在一起优化。他甚至展示了用Omniverse模拟的AI工厂数字孪生,用来在虚拟世界调试整个数据中心的功耗和散热。
听起来很美,但也意味着英伟达的研发复杂度正在指数级上升。
OpenClaw:智能体时代的Linux?
如果说硬件是英伟达的肌肉,那么软件和生态就是它的灵魂。这次演讲最大的意外,可能是黄仁勋花了大量篇幅介绍一个叫OpenClaw的开源项目。
OpenClaw太火了,简单说,它是一个能让开发者用自然语言创建AI智能体的框架。你只需要在终端输入一行命令,就能生成一个专属的Agent,它可以帮你写代码、管理文件、调用API,甚至半夜自动跑上百次实验,第二天给你报告结果。
黄仁勋把它比作Linux、Kubernetes和HTML,那些在关键时刻定义了下一代计算平台的开源技术。他还宣布英伟达将全力支持OpenClaw生态,并推出了企业级安全版本NemoClaw。
这个动作的战略意图很明显:英伟达想成为智能体时代的操作系统底座。
过去的IT世界由文件系统、数据库、SaaS工具构成,而未来的世界将由无数个AI智能体构成。这些智能体需要调用工具、访问数据、协同工作,也需要安全管控和策略执行。
如果OpenClaw能成为智能体的标准接口,那么英伟达就能从底层芯片到上层框架,牢牢卡住生态位。
但这里有几个问题。
第一,OpenClaw目前还只是一个社区项目,虽然蹿升很快,但距离成为真正的标准还有很长的路。Linux的成功花了三十年,Kubernetes的成功也离不开Google和云厂商的推动。英伟达能不能调动足够的开发者资源,还是个未知数。
第二,英伟达的“开放”到底有多开放?它同时推出了自己的NemoClaw参考实现,以及一系列Nemotron基础模型。这有点像Google当年推Android,名义上开源,但核心服务都握在自己手里。如果OpenClaw真的成了气候,英伟达会不会像控制CUDA那样控制它的演进方向?
第三,企业级AI智能体的落地远比消费级复杂。数据隐私、合规审计、与现有系统的集成,都是巨大的工程。黄仁勋也承认这一点,所以强调了安全护栏和策略引擎。但真正跑通这些场景,需要的是整个企业软件生态的配合,而不仅仅是英伟达一家的努力。
物理AI:机器人的ChatGPT时刻
除了数字世界的智能体,黄仁勋还花了很大篇幅讲物理AI,你可以干脆理解为机器人。
他宣布了一大串合作伙伴:比亚迪、现代、日产、吉利加入自动驾驶出租车阵营;Uber将在多个城市部署具备自动驾驶能力的车辆;ABB、KUKA、Caterpillar在用NVIDIA的仿真平台训练工业机器人;甚至迪士尼的机器人Olaf也上台走了一圈。
黄仁勋说,自动驾驶汽车的ChatGPT时刻已经到来。而人形机器人、手术机器人、仓储机器人,都在经历类似的转折。
从技术角度看,物理AI的难点在于数据。现实世界充满了边缘情况,不可能靠真实数据穷举。所以英伟达的策略是用仿真生成合成数据,在Omniverse里构建虚拟世界,让机器人在里面学习走路、抓取、避障,然后把学到的策略迁移到现实。
这个思路听起来合理,但落地并不容易。仿真和现实之间的“Sim-to-Realgap”一直是机器人领域的核心难题。英伟达的Newton物理引擎、Kosmos世界模型、GROOT基础模型,能不能真正缩小这个差距,还需要时间的检验。
另外,机器人的市场爆发比数字AI慢得多。工业机器人的部署周期长,人形机器人还处于原型阶段,自动驾驶的商业化也一波三折。英伟达在这个领域的投入虽然大,但短期内恐怕很难看到像GPU那样的回报。
写到这里,我不得不提几个问题。
首先是算力需求的可持续性。过去两年的算力暴涨,很大程度上是靠大模型的“军备竞赛”驱动的。如果模型规模的增长放缓,或者新的算法大幅降低了计算需求,英伟达的增长曲线会不会突然掉头?
老黄给出的答案是“推理拐点”,但推理需求能否像训练一样持续放大,还有待验证。
其次是竞争的压力。AMD的MI系列在追赶,AWS、Google、微软都在自研芯片,甚至连OpenAI都在传要自己做AI硬件。虽然短期内英伟达的优势难以撼动,但长期来看,云厂商肯定会想方设法降低对单一供应商的依赖。
抛开地缘性风险不谈,你也不能忽略OpenClaw的不确定性。英伟达想定义一个开源标准,但开源社区有自己的运行逻辑。如果社区觉得英伟达的控制欲太强,完全可以fork一个分支自己玩。历史上这样的例子并不少见。
黄仁勋的演讲像一场科技界的超级碗,信息轰炸之余,也留下了无数可以讨论的话题。
在我看来,英伟达今天的地位,是二十年技术积累和几次豪赌的结果。从CUDA到AI工厂,它一直在赌一件事:计算的未来属于加速计算,而加速计算的未来属于英伟达。
这个赌局还没有结束。接下来的几年,我们会看到AI工厂是否真的能像工业时代的工厂那样重塑经济,看到OpenClaw是否能成为智能体的Linux,看到机器人是否真的能走进我们的生活。
而对于我们这些旁观者来说,唯一能确定的是:这场变革的速度,只会越来越快。
原文标题 : 黄仁勋GTC演讲,我们梳理了的四个关键问题
