便宜的Token,难赚的钱:AI行业最尴尬的真相
Token变便宜,几乎是确定的事。芯片会更强,推理框架会更省,数据中心的利用率也会继续提高。只要工程效率还在往前走,单位Token的成本就会往下掉。但成本往下掉,不等于利润就会上来。这是两回事。过去不少人把大模型想成另一场“补贴战”:先把价格打下来,圈一波用户,盈利以后再说。可这套想法现在已经站不太住了。国内大模型市场这两年的风向已经很明显,单纯靠低价换规模、用补贴换规模的价格竞争正在收缩。不少头部企业都开始重新调整相关云服务和API的定价。这笔账其实并不难算。企业客户开始尝试把AI更多地接进客服、研发、法务、风控这些日常流程,Token消耗就是持续发生的,很多时候甚至是量级增长的。模型公司继续按“白菜价”卖Token,等于燃烧自己的利润,甚至家底,替客户承担推理成本。再不刹车,这就是个无底洞。所以,即使总体而言,Token的单价可以越来越便宜,但模型公司的策略选择,不可能再是“把所有Token都卖成一个价”,而只能是“精准定价”。在机器那里,每个Token对应的算力开销差不多,但到了客户那里,每个Token创造的价值却差很多。拿它陪人闲聊、写摘要,和拿它审合同、做药物筛选、跑金融决策,根本不是一回事。后者替客户省下来的,不只是时间,还有人工、出错成本和组织摩擦。模型公司当然会很快发现这一点。Anthropic公布的EconomicIndex报告也说明了这一点。最先大规模接住AI的,还是软件开发、技术写作这类结构清晰、容易拆分的工作。最先值钱的Token,并不会平均流向所有行业,而会先流向那些最容易把ROI算清楚的场景。对模型公司而言,真正能带来利润的,不是让机器做更多推理,而是让机器做“更值钱”的推理。决定这杯“水”能卖多少钱的,不只是造水的成本,更是它到底能帮客户赚回多少钱。模型公司想盈利,就得把最聪明的脑力,卖到最赚钱的行业里去。走到这一步,分层定价几乎是必然。便宜的通用Token,可以去处理那些高频、低价值的日常琐事;中等价位的Token,卖给能明确替代部分人力的标准化流程;而那些高溢价、最贵的Token,则专门服务医药、法律、金融这些高端场景。真正决定Token定价的标准,取决于它替客户省下了多少人工、时间和犯错成本。欧洲支付巨头Klarna的AI助手上线第一个月,处理了230万次对话,相当于700个全职客服的工作量,公司据此预计利润改善4000万美元。如果顺着这组数据粗算下去,这笔账就更直观了:230万次对话对应700个全职岗位,平均下来,一个岗位要处理三千多次对话;4000万美元利润改善,摊到这700个岗位上,接近每个岗位五万多美元。这里面不只是工资替代,也包括响应速度、处理效率和服务时长改善带来的收益。企业采购愿意继续买单,靠的正是这种能被换算、能被复核、也能被写进预算表的结果。Token一旦能和这些数字挂钩,它就不再只是技术单位,而成了财务语言。反过来,如果一个产品既贵,又说不清替企业省了多少钱,还时不时出错,采购就会停下来。微软的办公Copilot在不少企业推进缓慢,问题就出在这里。但定价,只解决了一半问题。利润最后留给谁,中国市场更早要给出答案。便宜当然重要,但更重要的是,中国的大模型公司更早被企业客户追着问一个很硬的问题:你到底能不能接进我的流程,替我省下真金白银?预算紧,ROI考核硬,试错窗口短,这是中国企业客户最真实的约束。很多时候,他们并不先问谁家模型分数最高,而是先问能不能接进客服、研发、法务、风控这些现有流程,能不能稳定跑起来,值不值得继续花钱。月之暗面创始人杨植麟在2026年GTC官方论坛上说过一句话,Token效率不仅关乎效率,也关乎智能的上限。如果只从商业角度理解,这句话很容易被看成“降本增效”。但放到AI模型的前沿探索里,效率本身就是能力的一部分。高质量数据、训练资源和推理预算都不是无限的,谁能用更少的Token学到更多东西,谁就可能在同样的约束下,把模型推到更高的上限,也更有可能在价格竞争里活下来,把利润留住。真实调用数据已经给出了一部分答案。第三方平台OpenRouter的数据长期显示,MiniMax、DeepSeek、月之暗面、智谱等中国模型的调用量排在前面。客户买单看的不是单项冠军,而是整体性价比。价格、响应速度、稳定性、接入难度,缺一不可。模型再强,接不进流程,进不去预算,最后也只是发布会上的明星产品。真正可能改变商业的,不是模型榜单上的座次,而是它能不能替企业把那些看不见、摸不着、却又极其昂贵的沟通和协调成本打下来。如果一个工具只能在发布会上展示自己有多聪明,却很难接入真实的审批、客服、代码或检索流程里,那它的价值就会一直停留在演示阶段。只有当AI能稳定替企业减少交接、找人、等待和返工这些内耗时,它才算真正开始创造利润。换成经济学家科斯的语言,这说的就是“交易成本”:AI要证明自己值钱,得证明它减少的不是PPT里的想象劳动,而是企业内部真实存在的沟通、交接、确认、审查和返工。未来能赚到钱的,未必是那些把模型做得最强的公司。模型当然重要,但真正能吃到最大红利的,很可能是那些掌握了企业入口、把接入难度降到最低、甚至重塑了公司工作流程的平台。到这里,这笔账才算真正算完。开发者盯着的是一张账单,资本市场盯着的是一张总账。谁既能把Token卖出价格,又能让产品在企业现有流程里稳定跑起来,谁才更有可能在下一轮AI竞争里留下来。时代越嘈杂,深度越稀缺。
