AI产业的新胜负手:词元的生产与编排|甲子光年智库


AI产业正在走向“代理式执行”,其核心生产逻辑也由“数据驱动”转为“词元驱动”,下一轮的争夺焦点将围绕词元的生产与智能编排展开。
1.AI产业正在进入“词元驱动”的代理式AI阶段

过去十多年,AI产业的核心能力经历了三次变化:从“识别世界”,到“生成内容”,再到“执行任务”。
在感知式AI阶段,模型主要处理图像、语音、文本等识别任务,AI的能力上限主要由标注数据规模、质量与覆盖度决定。AI更多作为识别工具嵌入软件系统中,完成感知与判断。
进入生成式AI阶段,以Transformer和大模型为代表,AI开始具备内容生成能力。模型不再只是“记忆数据”,而是在海量语料中学习语言、知识与模式,并通过对话窗口完成写作、绘图、编程、总结和交互。
但无论是感知式AI还是生成式AI,其底层逻辑仍然是“数据驱动”:数据决定模型能力的边界,AI的核心价值仍停留在信息处理与内容生成层面。
代理式AI(Agentic AI)的出现,开始改变这一逻辑。
AI不再停留在单轮问答或内容生成,而是开始面向具体任务进行规划、拆解、调用工具、访问系统,并在多轮上下文中持续推进执行流程。
一次任务的完成,往往对应大量词元(Token)的生成、调用、流转与消耗。词元开始不再只是模型计算中的计量单位,而逐渐成为连接算力、模型与应用的核心媒介。
在这一阶段,真正进入AI生产系统的,已经不再只是数据本身,而是经过切分、编码与标准化后的词元(Token)。
AI产业的核心生产逻辑,也开始从“数据驱动”逐渐转向“词元驱动”。

2.为什么“数字经济”会走向“词元经济”
经济模式的演进,本质上是人类需求、生产对象与生产要素持续升级的过程。
农业经济解决的是生存与温饱问题,人类直接从自然资源中获取基本生产资料;工业经济通过规模化制造满足物质消费需求;服务经济围绕商品形成专业分工,人们开始购买他人的专业劳动;数字经济则通过数据与软件系统提升信息流转与协作效率。
但AI开始带来一种新的变化:人类开始第一次规模“购买智能劳动”。人类已经不再满足于标准化产品、服务与效率工具,而是开始希望智能直接参与工作与生活。
这意味着,AI已经不再只是数字经济中的“效率工具”,而开始真正进入生产与劳动过程。当智能系统开始参与认知与执行,生产体系中的生产对象与生产要素,也开始同步发生变化。
生产对象开始从“效率工具”逐渐走向“代劳能力”。数字经济围绕信息流转构建数字化应用,而词元经济则在数字化基础上进一步嵌入智能能力,使生产系统开始具备思考与任务执行能力。
与此同时,生产体系的核心要素也在变化。数字经济依赖数据资产与系统能力,而在代理式AI阶段,AI生产体系开始需要一种新的智能生产单元。

3.为什么进入代理式AI生产系统的是词元,
而不是数据
很多人会自然地认为,数据就是代理式AI时代的核心生产要素,但这个理解只对了一半。数据决定了智能能力的来源与上限,却并不能直接进入代理式AI的生产过程。
原始数据往往是离散、静态且非标准化的,难以被模型直接组织、调用与持续执行。真正进入AI生产系统、参与推理、规划、生成与执行的,是经过切分、编码与标准化后的词元。
换句话说,数据提供原始资源,而词元才是能够进入生产系统的标准化材料。
数据更像自然资源,是词元生产的上游基础;而词元则更像工业原材料,具备可计算、可调用、可流通和可计量的特征,能够被模型直接加工,并进一步转化为智能生产能力。

4.代理式AI生产过程正在像工业体系一样被组织
在传统工业体系中,原始资源并不会直接形成最终产品。
矿石、原油等自然资源,需要先经过冶炼、提纯与标准化处理,才能转化为钢材、电力等工业原材料;随后,再进入制造工厂体系,通过加工、组装与调度,最终形成可被消费的工业产品。
代理式AI的生产过程,也开始出现类似的两段式生产结构。
原始数据本身并不能直接形成智能生产力,而是需要先经过“词元化”处理,转化为模型能够识别、计算与调用的标准件。随后,模型与智能体等再对词元进行规划、调度、推理与生成,最终形成可执行任务的代劳能力。

从数据到词元:生产的第一次加工,类似能源经济
从数据到词元的加工,解决的是“原始自然资源如何转化为标准件”的问题。
这一转化包含五个连续环节:
原始数据输入:汇聚来自文本、图像、音频等多源异构数据,作为后续加工的基础原始资料。
数据处理与编码:原始数据经过清洗、去重、分片、标注与结构化处理,去除噪声并建立基础组织形式。这是制造流程的预处理工序,决定后续加工的质量底线。
词元切分:将文本及多模态内容切分为离散的词元序列。这一步骤类似于将原材料按规格切割为标准件,使信息成为可计算的基本单元。
模型编码与语义化:通过位置编码与上下文理解,词元被转化为模型可识别的语义表示。此时离散单元获得了关系维度,形成可参与运算的向量结构。
词元成品:最终产出的词元是标准化、可计算、可计量、可存储、可流通的中间产品。它如同制造业的钢材——本身不直接对应终端价值,但具备精确规格和通用接口,可被进一步组装为各类应用。

从词元到代劳能力:生产的第二次加工,类似制造经济
词元作为标准件,本身并不具备独立智能,也无法直接劳动。从词元到代劳能力的转化,是将中间品组装为功能模块的过程,类似于离散制造中将钢材加工为汽车零部件乃至整车系统的环节。
这一转化也包含五个关键步骤:
词元输入:用户指令、知识检索等需求被转化为词元序列进入系统。这是制造订单的输入端——明确要“生产什么”,将模糊需求转化为机器可理解的加工指令。
智能调控系统:对输入词元进行理解、计算、推理、规划与生成。这是整个装配过程的核心控制中枢,决定了标准件如何被调度、组合与转化,其效率直接决定投入成本、产出质量与产品收益。
词元消耗:模型在推理过程中消耗词元,包括处理上下文、执行思考链、调用工具等中间计算。这一过程如同加工中心对原材料进行切削、打磨和成型,词元在持续计算中被重新组织与转化,是价值创造所必需的成本投入,尽管过程中会存在损耗。
词元产出:生成具有功能指向的结果词元序列——如可执行的代码、结构化分析报告等。这些产出词元类似于加工完成的功能部件,已具备特定功能属性,但需通过系统封装、场景集成与运行验证,才能组装为代劳能力成品。
代劳能力:词元转化为可执行任务或回答问题的能力单元,能够在特定场景下替代部分人类劳动。它如同由标准化零件和功能部件组装而成的整车,最终具备代步功能,并可投入实际的驾驶场景。

5.围绕词元运行的经济系统正在形成
当代理式AI的加工形成完整的生产体系后,词元的生产能力如何进入经济循环、实现价值变现,便成为核心议题。词元经济正是以“词元”这一大模型信息处理的“最小标准化单元”为核心载体,围绕词元的生产、调度、流通、消费构建的新经济活动模式。
词元经济的运行链路包含四个依次递进的环节:
词元生产是供给端,通过电力、数据、算力和模型训练形成词元供给。这对应前文所述的“第一次加工”——词元在这里转化为标准化中间件,而词元调度、流通与消费环节则对应前文所述的“第二次加工”。
词元调度作为中枢系统(AI OS)对词元进行组织、分配与计量。调度环节决定了词元资源的配置效率,是连接供给与需求的枢纽。
词元流通是能力封装层,将词元封装为技能、模板、插件和组件,形成可复用的开发资产。流通环节使词元功能化,降低跨场景使用的门槛。
词元消费是应用端,面向具体场景释放词元价值,最终实现智能能力向生产力的转化。消费环节是价值实现的落点——词元在此完成从“半成品”到“成品”的最终跳跃。

随着词元生产、调度、流通与消费链路逐步打通,词元调用与消耗量快速增长,表明词元经济已从概念讨论进入实际运行阶段。
国家数据局数据显示,2025年,全国日均词元调用量从年初的超万亿增长到年末的100万亿,全年词元调用量约21100万亿,而在2026年日均词元调用量已突破140万亿。

高盛预测,到2030年4月,全球消费者智能体和企业智能体每月将分别消耗约60万亿和56万亿词元,合计消耗量(116万亿)为2026年4月的24倍。

6.词元经济的生产函数: Y=O·F(T)
理解词元经济的运行逻辑,需要首先识别其生产函数的范式变化。
工业经济时代,产出主要由资本K与劳动L决定,生产函数可表达为Y=F(K,L)。资本与劳动的投入和产出之间存在相对稳定的对应关系,要素本身具有较强的生产力属性。
进入词元经济时代,核心生产要素转变为词元T。但词元并非天然等同于生产力,而是由电力E、数据D、算力C与模型M共同生成的高熵认知流,即T=G(E,D,C,M)。也就是说,词元具有分散、无序和不稳定的特征,难以直接作用于现实世界并形成经济价值。
因此,词元经济的生产函数需要在词元规模之外,引入第二层能力:智能编排能力O。其完整形式可表达为:Y=O·F(T)。
其中,O代表智能编排能力(Intelligent Orchestration Capability),包括记忆、约束、调度、协同与验证等机制。它的作用在于,将高熵的词元流组织为稳定、可执行、可复用的智能执行流。
在这一函数中,O扮演效率系数的角色:同样的词元供给下,O的高低决定了词元向经济产出的转化效率。当O较弱时,词元可能停留在低效调用、重复消耗或无序生成之中,难以形成稳定产出;当O持续优化时,词元能够通过接口、工具和流程嵌入现实场景,进一步转化为经济产出Y——代劳能力。

7.下一轮的AI竞争:
词元生产+词元编排的双轨竞争
词元经济的生产函数意味着,AI产业的竞争正在从单一的模型能力比拼,转向“词元生产”与“智能编排”的双轨竞争:既要比谁能以更低成本、更稳定可靠地生成更多词元,也要比谁能以更高效率将词元转化为实际生产力。
竞争的第一条主线是词元生产。电力、数据、算力、模型四大要素的获取与整合能力,决定了词元供给的规模与成本。这是基础设施层面的比拼,是入场的门票——没有充足的词元供给,后续的价值转化无从谈起。
竞争的第二条主线是词元编排。谁能通过更高效的智能编排能力O,将高熵的词元流转化为稳定、可执行、可交付的代劳能力,谁就能在同样的词元供给下创造更大的经济产出。这不仅是应用层面的竞争,更是中控级操作系统层的竞争。中控级操作系统层决定了模型、工具、数据、接口与业务流程能否被统一调度、动态协同和持续验证,并最终沉淀为可复用、可扩展的智能执行能力。
历史上,钢铁行业的竞争不仅在于谁能炼出更多钢材,更在于谁能将钢材精密加工为汽车、船舶与机械。词元经济亦然,当词元的生产门槛逐步拉平,智能编排能力将成为区分领导者与跟随者的核心壁垒。


END.





