便宜的Token，难赚的钱：AI行业最尴尬的真相

发布时间：2026-04-08来源：人工智能实验室

Token变便宜，几乎是确定的事。芯片会更强，推理框架会更省，数据中心的利用率也会继续提高。只要工程效率还在往前走，单位Token的成本就会往下掉。但成本往下掉，不等于利润就会上来。这是两回事。过去不少人把大模型想成另一场“补贴战”：先把价格打下来，圈一波用户，盈利以后再说。可这套想法现在已经站不太住了。国内大模型市场这两年的风向已经很明显，单纯靠低价换规模、用补贴换规模的价格竞争正在收缩。不少头部企业都开始重新调整相关云服务和API的定价。这笔账其实并不难算。企业客户开始尝试把AI更多地接进客服、研发、法务、风控这些日常流程，Token消耗就是持续发生的，很多时候甚至是量级增长的。模型公司继续按“白菜价”卖Token，等于燃烧自己的利润，甚至家底，替客户承担推理成本。再不刹车，这就是个无底洞。所以，即使总体而言，Token的单价可以越来越便宜，但模型公司的策略选择，不可能再是“把所有Token都卖成一个价”，而只能是“精准定价”。在机器那里，每个Token对应的算力开销差不多，但到了客户那里，每个Token创造的价值却差很多。拿它陪人闲聊、写摘要，和拿它审合同、做药物筛选、跑金融决策，根本不是一回事。后者替客户省下来的，不只是时间，还有人工、出错成本和组织摩擦。模型公司当然会很快发现这一点。Anthropic公布的EconomicIndex报告也说明了这一点。最先大规模接住AI的，还是软件开发、技术写作这类结构清晰、容易拆分的工作。最先值钱的Token，并不会平均流向所有行业，而会先流向那些最容易把ROI算清楚的场景。对模型公司而言，真正能带来利润的，不是让机器做更多推理，而是让机器做“更值钱”的推理。决定这杯“水”能卖多少钱的，不只是造水的成本，更是它到底能帮客户赚回多少钱。模型公司想盈利，就得把最聪明的脑力，卖到最赚钱的行业里去。走到这一步，分层定价几乎是必然。便宜的通用Token，可以去处理那些高频、低价值的日常琐事；中等价位的Token，卖给能明确替代部分人力的标准化流程；而那些高溢价、最贵的Token，则专门服务医药、法律、金融这些高端场景。真正决定Token定价的标准，取决于它替客户省下了多少人工、时间和犯错成本。欧洲支付巨头Klarna的AI助手上线第一个月，处理了230万次对话，相当于700个全职客服的工作量，公司据此预计利润改善4000万美元。如果顺着这组数据粗算下去，这笔账就更直观了：230万次对话对应700个全职岗位，平均下来，一个岗位要处理三千多次对话；4000万美元利润改善，摊到这700个岗位上，接近每个岗位五万多美元。这里面不只是工资替代，也包括响应速度、处理效率和服务时长改善带来的收益。企业采购愿意继续买单，靠的正是这种能被换算、能被复核、也能被写进预算表的结果。Token一旦能和这些数字挂钩，它就不再只是技术单位，而成了财务语言。反过来，如果一个产品既贵，又说不清替企业省了多少钱，还时不时出错，采购就会停下来。微软的办公Copilot在不少企业推进缓慢，问题就出在这里。但定价，只解决了一半问题。利润最后留给谁，中国市场更早要给出答案。便宜当然重要，但更重要的是，中国的大模型公司更早被企业客户追着问一个很硬的问题：你到底能不能接进我的流程，替我省下真金白银？预算紧，ROI考核硬，试错窗口短，这是中国企业客户最真实的约束。很多时候，他们并不先问谁家模型分数最高，而是先问能不能接进客服、研发、法务、风控这些现有流程，能不能稳定跑起来，值不值得继续花钱。月之暗面创始人杨植麟在2026年GTC官方论坛上说过一句话，Token效率不仅关乎效率，也关乎智能的上限。如果只从商业角度理解，这句话很容易被看成“降本增效”。但放到AI模型的前沿探索里，效率本身就是能力的一部分。高质量数据、训练资源和推理预算都不是无限的，谁能用更少的Token学到更多东西，谁就可能在同样的约束下，把模型推到更高的上限，也更有可能在价格竞争里活下来，把利润留住。真实调用数据已经给出了一部分答案。第三方平台OpenRouter的数据长期显示，MiniMax、DeepSeek、月之暗面、智谱等中国模型的调用量排在前面。客户买单看的不是单项冠军，而是整体性价比。价格、响应速度、稳定性、接入难度，缺一不可。模型再强，接不进流程，进不去预算，最后也只是发布会上的明星产品。真正可能改变商业的，不是模型榜单上的座次，而是它能不能替企业把那些看不见、摸不着、却又极其昂贵的沟通和协调成本打下来。如果一个工具只能在发布会上展示自己有多聪明，却很难接入真实的审批、客服、代码或检索流程里，那它的价值就会一直停留在演示阶段。只有当AI能稳定替企业减少交接、找人、等待和返工这些内耗时，它才算真正开始创造利润。换成经济学家科斯的语言，这说的就是“交易成本”：AI要证明自己值钱，得证明它减少的不是PPT里的想象劳动，而是企业内部真实存在的沟通、交接、确认、审查和返工。未来能赚到钱的，未必是那些把模型做得最强的公司。模型当然重要，但真正能吃到最大红利的，很可能是那些掌握了企业入口、把接入难度降到最低、甚至重塑了公司工作流程的平台。到这里，这笔账才算真正算完。开发者盯着的是一张账单，资本市场盯着的是一张总账。谁既能把Token卖出价格，又能让产品在企业现有流程里稳定跑起来，谁才更有可能在下一轮AI竞争里留下来。时代越嘈杂，深度越稀缺。

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。