英伟达反击芯片挑战者,推新业务

7月2日,彭博社报道称,英伟达正在推出一种收益分成模式,旨在帮助那些缺乏资金构建或租赁大规模计算资源的科研人员和早期人工智能公司。英伟达不再像以往那样向客户一次性收取一整机架GPU的费用,而是允许人工智能云服务提供商采购其基础设施,并将这些计算能力转售给初创公司,同时在原始硬件销售收入的基础上,向英伟达支付一部分由此产生的云收入。英伟达首席财务官科莱特·克雷斯(Colette Kress)在英伟达官方博客上共同撰写了这一公告,并指出该公司旨在填补一个市场空白:新兴人工智能公司历来难以获得资本密集型基础设施。
这是委婉的说法。直白地说,英伟达宁愿在未来几年里一直占据你的收入份额,也不愿在你有能力货比三家时,因为价格更低的芯片而失去你。
这套机制通过云合作伙伴运作,而非直接通过创始人的银行账户。在新架构下,Sharon AI 正在部署多达 4 万个英伟达 Grace Blackwell GB300 GPU。Firmus Technologies 正在印尼巴淡岛建设一个 DSX AI 工厂园区,英伟达表示该园区最终将扩展至 360 兆瓦的电力容量和 17 万个 GPU。在客户方面,英伟达列举了 Baseten、Fireworks AI 和 Together AI 等公司作为该项目的目标客户:这些原生 AI 企业需要训练、微调和推理能力,但无意自建数据中心。他们租用计算资源。只要他们持续使用,英伟达就会从云服务提供商的账单中抽取一部分作为佣金。
这与一次性GPU销售有着本质的区别。它将英伟达的收入与初创公司实际使用的GPU数量挂钩,而不是与初创公司在成立之初的购买能力挂钩。
这是更大模式的一部分
这并非英伟达首次涉足客户的未来。据CNBC和TechCrunch报道,截至2026年,该公司已承诺向人工智能公司投资超过400亿美元,其中包括对OpenAI约300亿美元的投资,以及对康宁和数据中心运营商IREN数十亿美元的投资。Wedbush分析师Matthew Bryson承认,这一切显然存在循环论证:资金从英伟达流入这些公司,而这些公司反过来又会购买英伟达的芯片。但他认为,如果这种策略奏效,就能为公司构建起一道坚固的护城河。Tom's Hardware的措辞则更为直白,称英伟达正在将GPU转化为资本,并警告说,人工智能公司越来越多地像融资债务一样为硬件融资。
本周宣布的收入分成模式,其理念与较低一级的模式相同,即对规模太小或发展阶段太早而不值得进行股权激励的公司进行激励。
这其中也包含着防御逻辑,而英伟达对此也毫不掩饰。定制芯片正在成为现实。谷歌的TPU已经承担了相当一部分内部AI工作负载,芯片初创公司不再是理论上的威胁。据TechCrunch报道,专注于Transformer芯片的制造商Etched本周估值达到50亿美元,系统订单额达到10亿美元。英伟达去年底斥资200亿美元收购Groq的技术并吸纳其大部分团队,与其说是为了收购,不如说是为了遏制竞争对手。一家初创公司可以通过向英伟达支付未来收入分成来延缓GPU的开发,因此它几乎没有理由花费一年时间去评估TPU集群或Groq LPU。
坦白说,对创始人的推销很简单:省去用于基础设施建设的融资,省去多年托管合同,直接开始培训。成本会在之后以百分比的形式悄悄计入产品最终的每一美元收益中。对于那些正为无力支付的计算费用而苦恼的创始人来说,这无疑是一个极具吸引力的方案。英伟达也乐于同时投资数千家初创公司:有些会失败,但不会给英伟达造成任何损失;而那些成功发展壮大的公司则会在未来几年持续贡献一部分收入,英伟达也无需事先收购它们。
NVIDIA 解锁大规模 AI 计算
随着人工智能从模型开发转向生产推理,计算需求正在加速增长,并转向持续运行的、能够大规模生成代币的人工智能工厂。这种转变需要大规模、多租户的加速计算资源,这些资源能够快速上线,保持高利用率,并支持代币级人工智能服务的经济效益。
新兴人工智能公司历来难以获得资本密集型基础设施,即使是长期承诺也无法获得计算所需的资金。
为了解决这个问题,NVIDIA 推出了一种新的商业模式,向快速增长的 AI 生态系统(包括初创公司、模型构建者、企业、研究机构和区域性 AI 参与者)开放计算资源。
这种新模式使AI云平台能够通过与收入分成和信用支持模式的经济合作,为AI原生应用、企业级应用和独立软件供应商(ISV)客户采购NVIDIA基础设施。通过此次合作,AI云平台将销售基于NVIDIA技术的云服务,NVIDIA将获得标准产品收入以及所支持容量的云收入分成。这种结构加速了NVIDIA平台在高增长、高信心的AI原生应用领域的普及,并为NVIDIA提供了持续的、与使用量挂钩的收入来源。
对于模型构建者、推理提供商、代理平台和扩展 AI 的企业而言,这意味着可以更快地获得全栈加速计算,而无需等待选址、电力采购、建设和硬件启动。
该计划已初具规模,人工智能云公司正在构建 DSX AI 工厂,旨在为跨地区的客户和工作负载提供服务。
Sharon AI 和 Firmus 是首批与 NVIDIA 合作开发这种新商业模式的公司之一。
Sharon AI 正在部署多达 40,000 个 NVIDIA Grace Blackwell GB300 GPU。
Sharon AI 联合创始人兼首席执行官 James Manning 表示:“与 NVIDIA 的这项战略合作标志着 Sharon AI 在提供自主、大规模 AI 计算基础设施的使命中迈出了关键一步。”
Firmus正在印度尼西亚巴淡岛建设DSX人工智能工厂园区。该园区预计规模将达到360兆瓦,并配备多达17万个NVIDIA GPU。
Firmus Technologies联席首席执行官 Tim Rosenfield 表示:“人工智能原生企业需要获得可扩展、节能且经济高效的计算基础设施才能在全球范围内参与竞争。Firmus AI 云正在构建一个与 NVIDIA DSX 兼容的 AI 工厂,这将使我们的云能够帮助更多客户获得构建和扩展 AI 所需的计算资源。”
像 Baseten、Fireworks AI 和 Together AI 这样的 AI 原生企业表明了计算需求的未来走向:他们需要立即访问 AI 云容量,以便为开发者、数字原生企业和使用 AI 构建产品的企业运行模型训练、训练后处理、微调和高容量智能推理。
随着使用量的增长,他们的客户需要可靠地访问大规模 NVIDIA 加速计算,但随着产品从试点阶段过渡到生产阶段,他们也需要商业灵活性。
点这里👆加关注,锁定更多原创内容
*免责声明:文章内容系作者个人观点,半导体芯闻转载仅为了传达一种不同的观点,不代表半导体芯闻对该观点赞同或支持,如果有任何异议,欢迎联系我们。
推荐阅读

喜欢我们的内容就点“在看”分享给小伙伴哦~![]()

