豆包付费背后:Token大降价的时代落幕了
2026
年
5
月
4
日
,
当大多数
人还在享受假期的最后一
时
天,一道来自苹果
AppStore
的更新通知,在科技圈炸开了锅。
拥有
3.45
亿月活的国民级
AI
应用豆包
正式推出三档付费服务:标准版
(
68
元
/
月)
、加强版
(
200
元
/
月)
、专业版
(
500
元
/
月)
。付费墙主要针对
PPT
生成、数据分析、影视制作等复杂生产力场景,免费版虽保留,但在高价值任务上被
“
降级
”
为体验版。
消息一出,
“
豆包付费
”
瞬间冲上微博热搜榜首,话题阅读量迅速破亿。评论区
更是
直接成了大型声讨现场
。
很多人不解:豆包
为
什么要收费?
表面看是豆包
“
突然想赚钱
”
,但回到行业语境就会发现,这并不是一次孤立的商业动作,而是
Token
价格持续攀升后的一次必然传导。尤其是
AI
智能体广泛落地之后,
Token
消耗规模呈爆发式增长,底层算力需求被直接推高,成本压力沿着
“
硬件
→
云
→
应用
”
的链条一路向下游流动,最终抵达用户面前。
数据也验证了这一点。截至
2026
年
3
月,豆包大模型日均
Token
使用量已突破
120
万亿,相比
2024
年
5
月发布时增长了整整
1000
倍。浙商证券测算显示,
2025
年字节跳动资本开支约
1600
亿元,其中
900
亿元
用于
AI
算力采购
——
相当于每天
4.38
亿元的投入强度。
而相较于
传统互联网
的逻辑
——
用户越多,广告越值钱,边际成本趋近于零
——
AI
产品的经济模型是
“
颠倒
”
的
——
每多一个活跃用户,不是多了一个广告位,而是多了一行实打实的算力账单。
所以,
豆包不是
“
突然想赚钱了
”
,而是到了
“
不得不赚钱
”
的时候。
01.
曾经的
“
白菜价
”
事实上,早在两个月前,
算力涨价的信号就
已经
响彻整个行业。
3
月
11
日,腾讯云率先宣布上调两款自研模型
TencentHY2.0Instruct
和
TencentHY2.0Think
的价格。以
HY2.0Instruct
为例,输入价格从
0.0008
元
/
千
Token
上涨到
0.004505
元
/
千
Token
,涨幅达
463%
。同时,腾讯云结束对
GLM-5
、
MiniMax2.5
、
Kimi2.5
三款模型的免费公测,转为正式商用服务。
紧随其后,
智谱
AI
在
3
月
16
日上调
GLM-5-Turbo
的
API
价格,幅度为
20%
。这
也
是智谱
短
期
内的
二次涨价。
3
月
18
日,行业迎来涨价高潮
——
阿里云与百度智能云在同步宣布涨价,阿里云明确,平头哥真武
810E
等
AI
算力卡产品价格上涨
5%-34%
,文件存储产品
CPFS
(智算版)
上涨
30%
;百度智能云则上调
AI
算力相关产品服务价格
5%-30%
,并行文件存储等产品价格同样上调
30%
,两家均将涨价生效时间定在
2026
年
4
月
18
日,为老客户留出一个月的缓冲期。
短短数天,国内三大云厂商集体提价,传递的信号再明显不过:
AI
算力的价格重估,已经从试探变成了行业动作。如今豆包推出付费订阅,不过是把这种成本压力从
“
厂商端
”
延伸到了
“
用户端
”
。
但把时间轴拨回一年多前,情况完全是另一幅光景
——
彼时国内大模型市场正深陷惨烈的价格战,
Token
价格一路跌进
“
毫厘时代
”
。
2024
年
5
月,字节在火山引擎发布会上
宣布
:豆包通用模型
pro-32k
,输入价格
0.0008
元
/
千
Tokens
,
而
当时
市面上同规格模型的定价一般为
0.12
元
/
千
Tokens
,是豆包模型价格的
150
倍。
字节逼得所有国产大模型
价格
集体跳水。阿里云迅速跟进,通义千问主力模型价格直降
97%
,最低至
0.0005
元
/
千
Token
,
1
元可兑换
200
万
Token
,相当于
5
本《新华字典》的文字量。
这场价格战愈演愈烈:
2024
年下半年,阿里云三度降价,视觉理解模型降幅超
80%
;豆包视觉理解模型定价
0.003
元
/
千
Token
,
1
元可处理
284
张
720P
图片。短短半年,国内大模型
API
价格从
0.1-0.12
元
/
千
Token
跌至
0.001
元级别。
火山引擎总裁谭待在宣布豆包大模型价格时
曾表示
:
“
大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。将大模型使用从以分计价推进到以厘计价,将助力企业以更低成本加速业务创新。大模型降价,不能只提供低价的轻量化版本,主力模型和最先进的模型也要够便宜,才能真正满足企业的复杂业务场景需求,充分验证大模型的应用价值。
”
话虽如此,但这场
价格战,
本质上还是
头部厂商的零和博弈
——
用低价抢占市场份额,逼退中小玩家,为后续掌握定价权埋下伏笔
,这
不是终点,而是
一次战略铺垫。
02.
涨价背后的
深层原因
据
IDC
发布的《中国大模型公有云服务市场分析,
2025H1
》显示,
2025
年上半年,火山引擎以
49.2%
的市场份额位居第一,阿里云百炼平台以
27.0%
排名第二,百度智能云千帆平台以
17.0%
位列第三,三家头部厂商合计占据
83.2%
的市场份额。
价格
战的成果已经显现
——
大模型公有云的头部格局基本定型,
定价权
也随之向少数玩家高度集中
,
厂商
们
拥有了从
“
以价换量
”
走向
“
以供定价
”
的现实基础。
而
供需的
失衡
,又为企业战略转向提供了最佳窗口。
沙利文
2026
年
2
月发布的报告显示,
2025
年下半年中国企业级大模型日均调用量飙升至
37.0
万亿
Token
,较上半年的
10.2
万亿
Token
暴涨
263%
,半年实现近
3
倍扩容。
这一增长的背后,是
AI
从
“
对话模式
”
向
“
Agent
模式
”
的演进。一个复杂
Agent
任务的
Token
消耗量,可达普通对话模式的几十甚至上百倍。
Agent
深度融入工作流后,
Token
成为
AI
时代的核心生产资料与价值衡量标尺。
以
OpenClaw
为代表的
AI
应用迎来部署热潮,
Token
调用量激增。根据在线
AI
托管平台
OpenRouter
发布的数据,在
2026
年
3
月
9
日至
15
日这一周,中国
AI
大模型的周调用量飙升至
4.69
万亿
Token
,环比大涨
11.83%
;而同期美国大模型调用量则下滑
9.33%
,降至
3.294
万亿
Token
。
全球调用量前三被中国模型霸榜:
MiniMaxM2.5
以
1.75
万亿
Token
五连冠,阶跃星辰
Step3.5Flash
摘得榜眼,
DeepSeekV3.2
以
1.04
万亿
Token
稳居第三。
摩根大通预测,中国的
AI
推理
Token
消耗量预计将从
2025
年的约
10
千万亿增长至
2030
年的约
3900
千万亿,五年间增长约
370
倍。
需求暴涨的同时,供给侧却面临瓶颈。
阿里云在公告中明确表示,涨价原因是
“
全球
AI
需求爆发、供应链涨价,行业核心硬件采购成本显著上涨
”
。据知情人士透露,此轮涨价另一个重要原因是
"
Token
调用量暴涨
"
,阿里云正在将紧缺的
AI
算力资源向
Token
业务倾斜。
网宿科技、优刻得等也于
2026
年
2-3
月相继发布涨价函。
IDC
中国研究经理崔婷婷表示:
“
AI
需求爆发导致国际和国内核心硬件相关供应链供货紧张,交付周期拉长。全球
AI
基础设施主要玩家纷纷官宣在未来
3-5
年之内加大
AI
战略投资,导致缺口巨大,硬件供应商在供需预判调转情况下加速涨价,这也加剧供应链涨价趋势,使得云计算市场成本提升。
”
这一趋势是全球性的。
2026
年
1
月,亚马逊
AWS
将其
EC2
机器学习容量块服务价格上调约
15%
,打破了
AWS
二十年
“
只降不涨
”
的定价传统。谷歌云宣布自
2026
年
5
月
1
日起上调全球数据传输服务价格,北美地区每
GB
费率从
0.04
美元翻倍至
0.08
美元。
2026
年
3
月
18
日,腾讯发布
2025
年四季度及全年财报,腾讯董事会主席兼
CEO
马化腾宣布,
2025
年腾讯云实现规模化盈利。腾讯扭转了此前的保守投入策略,明确提出
2026
年
AI
新产品投入将至少翻倍增长。
阿里巴巴则成立了由
CEO
吴泳铭亲自挂帅的
AlibabaTokenHub
(
ATH
)
事业群,希望打通
Token
创造、输送、应用的全链条。这意味着阿里云的商业化收入需在五年内翻
7
倍,年均增速超
40%
。
03.
影响与未来:
Token
经济的新时代
当头部厂商把竞争重心从
“
抢份额
”
切换到
“
抢定价权
”
,涨价就不再只是财报数字上的调整,而会沿着产业链向上下游同时传导
——
不同环节的企业,正面临截然不同的处境。
对中小企业而言,成本压力开始显性化。
一家运营小型网站的企业技术负责人告诉
DoNews
:
“
我们用的是百度智能云,但没有采购
AI
算力和并行文件存储。
”
言下之意,这轮涨价对他们影响有限。但对于深度依赖
AI
算力的企业,压力将显著上升。
应对路径主要有两条:一是通过模型蒸馏、缓存复用等手段优化
Token
使用效率,降低单位任务消耗;二是不再盲目追求
"
最大最强
"
,而是按场景选择性价比更高的模型。
对云厂商而言,分化正在加剧。
阿里、腾讯、百度三家步调一致,形成
“
涨价联盟
”
。而京东云等追赶者,则用
"
不涨价
"
策略差异化竞争,试图从头部厂商手中抢夺对价格敏感的客户。
这种分化并非坏事
——
它意味着云市场正从单一价格战走向分层定价:高端市场讲
“
优质优价
”
,中低端市场讲
"
性价比
"
,两端各取所需,反而比一味
的
“价格战”更
有利于行业长期健康发展
。
对算力产业链而言,一轮新的收获期正在到来。
涨价潮的另一面,是
AI
芯片、服务器、数据中心、云计算整条链路的业绩兑现。国盛证券分析认为,
随着国内市场
Token
消耗量爆发,国产算力有望凭借成本优势及生态完善,在基础设施层逐步占据主导。投资建议关注
AI
Infra
产业链,包括深信服、海光信息、寒武纪、海天瑞声、并行科技、青云科技等。
把视角拉长,还能看到三条更确定的趋势。
其一,
Token
正式成为
AI
时代的核心生产资料。
AI
进入
Agent
时代的核心特征,就是
Token
的海量消耗。
Token
不再仅仅是计价单位,而是价值衡量的标尺。也正因此,巨头们纷纷把
Token
经济纳入战略层面:
腾讯计划翻倍加码
AI
新产品投入;阿里设立
ATH
事业群打通
Token
全链条;联通宣布抢抓
Token
经济创新机遇。
其二,云计算的定价逻辑,已从
“
规模降价
”
切换为
“
供需定价
”
。过去,云厂商靠
“
规模
-
降价
-
扩量
”
的正向循环不断做大市场;但当
AI
算力成为稀缺资源,价格便不再由单一厂商主导,而是由真实供需决定。业内人士也直言,
未来如果供应链成本继续上升,不排除云计算厂商再次涨价的可能性。涨价可能是新常态,而非短期波动。
其三,
Token
经济的市场规模将呈指数级扩张
。摩根大通预测,中国
AI
推理
Token
消耗量将从
2025
年的约
10
千万亿增长至
2030
年的约
3900
千万亿,五年增幅约
370
倍。这意味着
,
能够在这一浪潮中存活的企业,不是那些依赖
"
白菜价
"
算力的玩家,而是能够创造真实价值、优化
Token
使用效率的应用方。
回到
开始关于
豆包付费的舆论风暴,答案已经不言自明。豆包宣布收费的那一刻,舆论看到的是价格,但真正值得关注的,是
AI
行业底层货币体系的切换
——Token
不再是廉价的流量耗材,而是新一轮数字经济的核心计价单位。
结语:
告别幻想,回归价值
Token
大降价时代的结束,不是
AI
发展的倒退,而是产业成熟的标志。
回顾历史,从
OpenAI
在
2020
年开创
Token
计价模式,到
2024
年中国云厂商的
“
价格战
”
,再到
2026
年的
"
涨价潮
"
,这一轮回背后是
AI
产业从技术探索到商业落地的完整周期。
对企业而言,幻想
“
白菜价
”
算力持续存在已不现实。正确的策略是:正视成本上升的现实,优化
AI
应用效率,将
Token
用在真正创造价值的场景上。
Token
经济爆发的大幕刚刚拉开。在这个新时代,只有真正创造价值的应用,才能在这场从
“
价格战
”
到
“
价值战
”
的转型中存活下来。
(来源:DoNews)
