【AI】AI正式进入“淘汰赛”:烧钱与赚钱的生死竞速

技术还在加速,但市场已经等不及了。
5月上旬的AI圈,密集得像一场没有中场休息的拳击赛。一边是模型迭代的速度丝毫不减——OpenAI将GPT-5.5 Instant设为默认模型,百度发布训练成本压低至业界6%的文心5.1,DeepSeek以500亿美元估值继续推进融资,谷歌向Anthropic开出400亿美元的投资承诺。另一边,资本市场的耐心正在急剧消耗:AI板块单周大幅波动频现,Cloudflare在收入创历史新高的背景下宣布裁员20%,1100人被AI替代。
过去两年,AI产业的主旋律是“谁能做出更强的模型”;而现在,游戏规则正在被重写。新命题只有一个:谁能在烧光钱之前找到赚钱的路。
一、技术狂热尚未退潮,但分化已经到来
2026年4月至5月,被称为大模型的“超级更新月”。模型更新密集到了令人窒息的地步:OpenAI、Anthropic、DeepSeek、阿里巴巴、月之暗面、字节跳动,头部厂商几乎全部完成了新一轮迭代。根据Artificial Analysis和LMArena的盲测数据,当前的全球格局呈现代际分层:GPT-5.5在Terminal-Bench智能体测试中以82.7%横扫全场,成为“Agent编程全能王”;Claude Opus 4.7以80.9%的SWE-bench成绩继续稳坐代码工程王座;Gemini 3.1 Pro则在科学推理中以94.3%的GPQA得分刷新人类纪录。
技术竞赛似乎在加速狂奔。但仔细拆解,这些迭代背后有一个微妙但至关重要的变化:真正的差异点,已从“模型是否更强”,转向了“模型能否在真实场景中持续有效地完成任务”。
METR评估机构最新测试显示,Claude Mythos Preview早期版本在228项任务套件中达到50%成功率对应的时长已超过16小时,是此前最优模型的2倍以上。这标志着模型自主任务能力从“数小时”级跨越到“隔夜”级,开始触及无人托管部署的临界点。同一周,菲尔兹奖得主Timothy Gowers披露,使用未公开的GPT-5.5 Pro在约一个小时内完成了关于和集直径上界估计的数学证明,成果堪比人类数学家苦思数周的水平。
然而,这些令人惊叹的“智力展示”,距离商业场景中“稳定可靠地完成任务”之间,仍然横着一条巨大的鸿沟。36氪近期报道揭示了一个残酷现实:“软件业正在经历AI大洗牌——要么AI增收10%,要么利润40%,中间地带全是无人区”。
二、Agent落地:技术跑得很快,应用跟得很慢
当前行业最热的词,非“Agent”(智能体)莫属。中信证券研判认为,5至6月将成为下一轮模型密集迭代窗口期,长程智能体(Long Horizon Agent)和多模态将成为新的规模化扩展方向。OpenAI的GPT-5.5被定位为“Agent原生大脑”,谷歌将自身AI平台全面重组为“Gemini Enterprise Agent Platform”,Anthropic的Claude Code则在Linux内核中发现了一个隐藏23年的可远程利用漏洞,连Linus Torvalds团队都未曾察觉。
Agent应用在平台层面的爆发同样迅猛。Nous Research旗下Hermes Agent单日Token消耗量达到2710亿,历史性地超越OpenClaw,登顶OpenRouter全球应用调用榜第一名。小米MiMo是其调用量最高的底层模型,这意味着国产开源模型正在成为全球Agent应用的关键基础设施。
然而,高盛5月7日发布的最新研报揭示了一个更真实的落地画像:当前全球企业级智能体的大规模部署率仍不足25%,多数应用仍集中在客服、IT运维等基础场景【参考上下文】。Agent落地真正的障碍,不是模型能力不够,而是工作流重构的成本和工程化落地的体系化挑战。
Mistral AI在5月1日推出的Workflows产品,以及谷歌开源的Agent Skill超级工具箱,都在试图解决同一类问题:让AI不再是“单干户”,而是一个可以协同工作的“团队”。MCP(Model Context Protocol)已接入约1万个服务器,月SDK下载量达9700万次;A2A(Agent-to-Agent)通信协议正在成为多智能体协作的标准化基础设施。
这些基础设施的成熟,意味着Agent正在从“能不能做”的阶段,进入“能不能规模化做”的新阶段。但当底层模型成本以每年60%至70%的速度下降时,竞争壁垒将迅速从模型能力迁移到场景深度的积累上。
三、资本在追逐,也在重新算账
资本市场的动作密集程度,丝毫不亚于技术端的更新节奏。
DeepSeek正向政府支持的投资者筹集数十亿美元资金,部分潜在投资者给出的估值高达500亿美元。月之暗面即将完成约20亿美元新一轮融资,投后估值突破200亿美元,仅今年上半年融资就超39亿美元,位列国内大模型创业公司之首。谷歌向Anthropic承诺了高达400亿美元的投资。阶跃星辰完成近25亿美元融资并全力冲刺港股IPO【参考历史对话】。SpaceX与Anthropic签署协议,开放Colossus 1数据中心全部算力容量——该系统配备超过22万颗英伟达GPU。
但与此同时,全球大语言模型市场2026年第一季度总收入约207亿美元,前三名Anthropic、OpenAI、Google的收入份额分别为31.4%、29%、12.1%。国内市场,AI原生APP月活用户已达4.4亿,豆包、千问、DeepSeek月活分别达3.45亿、1.66亿和1.27亿。
高投入与相对有限的收入之间,存在显著的不对称。第一财经指出:“全球大模型产业正从‘烧钱换流量的野蛮生长阶段’迈入理性成熟期,竞赛的核心命题也从‘谁的模型更强’转向‘谁先赚钱’”。
Gartner最新预测为这股热潮提供了注脚:2026年全球IT支出预计达到6.31万亿美元,其中数据中心系统支出增速高达55.8%,超过7880亿美元。但钱往基础设施上砸的同时,应用层的回报缺口也在同步扩大。
四、算力之争:从“能不能买到”到“能不能自主”
算力,一直是AI产业最敏感的神经。5月以来,两件事让这根神经再度紧绷。
一是昆仑芯正式启动科创板上市辅导,同时其在港交所的A1表格已在年初提交。这标志着百度自研AI芯片的独立发展进入资本市场的实质性阶段。与之并行,华为正目标在2026年主导中国AI芯片市场,计划第四季度推出更先进的950DT。据估计,在英伟达高端产品受出口管制限制的背景下,国内AI硬件市场规模到2030年可能达到670亿美元。
二是英伟达CEO黄仁勋在公开表态中承认,在现有出口管制框架下,英伟达在中国AI加速器市场的份额已被压到“零”。他选择了一种精细的话语策略:一方面表态中国“不应该拥有”最先进的芯片,以此与国家安全叙事对齐;另一方面强调美国应允许英伟达在中国市场竞争,否则“只会让正在加速成熟的中国本土技术走向全球市场与美国企业正面竞争”。
出口管制并没有让中国市场的AI算力需求消失,而是将订单转向了本土替代方案。黄仁勋的警告,与其说是为英伟达争取利益,不如说是对整个AI产业格局的预判:人为筑起的技术高墙,正在催生一个全新的算力供给格局。这一格局变化对中国AI产业链的影响是双重的:短期内算力供给可能面临成本与供给的约束,但中长期则倒逼国产芯片实现跨越式突破。
同一天,另一条消息同样值得关注:中国已要求AI初创企业在未获明确批准的情况下拒绝来自美国的融资。此举发生在Meta以20亿美元收购中国AI Agent公司Manus之后。AI领域的竞争,已不可避免地嵌入了更复杂的地缘政治语境。
五、Zero君的核心判断:AI进入“淘汰赛”的三个信号
复盘过去两周发生的一切,我认为AI产业正在经历一轮本质性洗牌。以下五个判断,或许能帮助产业参与者看清方向:
判断一:“好用”比“更强”更值钱。
GPT-5.5的综合能力固然惊艳,但真正让商业客户买单的,是Claude Opus 4.7在高强度编程场景中的稳定表现、是文心5.1以1/3参数量保持竞争力的成本控制、是Hermes Agent单日超2700亿Token消耗背后真实且高频的使用场景。商业价值的衡量标准正在转移——“更强”是实验室里的勋章,“好用”才是客户打开钱包的理由。
判断二:大模型公司必须回答“怎么赚钱”这个终极问题。
2026年第一季度,全球大语言模型市场收入约207亿美元。听起来不少,但头部玩家的融资额已经追上了它们的年化收入。DeepSeek估值破500亿美元只是开始;当资本耐心耗尽时,那些只有技术没有商业模式的公司将最先出局。资本扶持与技术自主之间的张力,对全球AI竞争格局的影响将远超单一的价格战。
判断三:开源正在成为事实上的行业标准。
从中国电信星辰大模型三款模型在Hugging Face月下载量破万并跻身全球前1%,到阿里Qwen团队开源的WebWorld网页世界模型让AI智能体能够像人类一样浏览和操作网页,国产开源模型正在全球生态中占据越来越重的位置。开源带来的不仅是技术民主化,更是一种全新的竞争范式——生态的广度与活跃度,正在取代单点技术指标,成为衡量模型生命力的新标尺。
判断四:地缘政治不是变量,是常量。
黄仁勋的“零份额”表态和中国对美资的收紧,都在说明同一件事:中美两个AI生态系统正在加速分化,任何一个AI创业者都必须把地缘政治纳入基本经营假设。这不是短期的风控变量,而是长期的战略常量。但分化不等于完全脱钩,两套系统间的技术交流与人才流动仍在持续,只是形式正在改变。
判断五:AI行业的淘汰赛已经开始。
密集的模型更新背后,是各大厂商在各自路径上的加速分化。未来12个月,CEO们面临的核心挑战不再是“追不追得上GPT”,而是“如何在不依赖外部输血的情况下活下来”。技术溢价正在被规模化应用替代,商业模式的可行性才是真正的护城河。
六、给产业决策者的三点建议
建议一:把“成本”而不是“能力”作为第一选型指标。
当文心5.1能把训练成本压到业界6%,当小米MiMo能在Agent高并发场景下以极致成本实现规模化部署,当开源模型让顶级能力几乎免费获取时,选型逻辑需要从“谁最强”转向“谁性价比最优”。在这波淘汰赛中,活下来的往往不是最强的,而是能耗最低的。
建议二:Agent是一个工程问题,不是一个模型问题。
不要被“智能体时代”的概念冲昏头脑。Agent落地的真正瓶颈不是模型能力,而是多步骤任务的可靠性、上下文管理的连贯性、工具调用的准确性。这些是工程问题,需要在场景中反复打磨。企业部署Agent应遵循“先小后大、先简后繁”的原则,先从一个封闭任务出发,逐步扩展复杂度。
建议三:算力自主不是一个可选项,而是一个必选项。
从出口管制到中美AI资本链条的进一步收紧,外部不确定性不会变小。对于中国企业而言,尽早完成主流国产芯片的适配、探索“国产芯片+国产框架+开源模型”的完整技术栈,是降低供应链风险的必要动作,也是在即将到来的算力格局变动中占据主动的关键一步。
这是AI产业最热闹的时代,也是最残酷的时代。当潮水退去,我们才能看到谁在裸泳。
你怎么看这轮AI淘汰赛?欢迎在评论区聊聊你的观察。
作者:Zero君 | 人工智能产业链union
关注我们,获取AI产业链深度解读与独家产业洞察。
参考来源:第一财经、IT之家、高盛研报、中信证券、Gartner、Artificial Analysis、QuestMobile、晚点LatePost等。
☟☟☟
☞人工智能产业链联盟筹备组征集公告☜
☝
人工智能产业链联盟高端社区
【中国风动漫】《雾山五行》大火,却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折!

免责声明:部分文章和信息来源于互联网,不代表本订阅号赞同其观点和对其真实性负责。如转载内容涉及版权等问题,请立即与小编联系(微信号:913572853),我们将迅速采取适当的措施。本订阅号原创内容,转载需授权,并注明作者和出处。如需投稿请与小助理联系(微信号:AI480908961)
编辑:Zero




