图灵奖得主杨立昆 认为:只会“文字接龙”的 AI,没有未来?
点击上方“图灵人工智能”,选择“星标”公众号
您想知道的人工智能干货,第一时间送达

杨立昆离开 Meta 押注世界模型,正在把 AI 竞争从参数规模战拉回真实世界。

图1:杨立昆肖像与世界模型转向
来源:Wikimedia Commons / Jérémy Barande,CC BY-SA 2.0
在全球 AI 行业疯狂堆叠参数、算力和数据的当下,图灵奖得主、深度学习三巨头之一杨立昆(Yann LeCun)给出了一个极具争议的判断:仅靠自回归大语言模型,很难走向真正可靠的高级机器智能。
他的批评并不是否定大模型的工具价值。恰恰相反,LLM 已经证明自己能写作、编程、检索、总结、对话。但在杨立昆看来,它们更像强大的语言接口,而不是能理解现实、预测因果、规划行动的智能体。
换句话说,今天最火的大模型,可能只是 AI 发展史上的过渡形态。真正的下一站,不是更大的文字接龙机器,而是能够在真实世界中学习、预测和行动的世界模型。
▌一、从 CNN 到图灵奖:他为什么有资格质疑大模型
杨立昆出生于法国,是卷积神经网络的重要奠基者之一,并与 Geoffrey Hinton、Yoshua Bengio 共同获得 2018 年 ACM A.M. 图灵奖。
在深度学习从学术边缘走向产业中心的过程中,他既是参与者,也是少数不断提醒行业“别把当前路线神化”的人。
▌二、他为什么敢说:纯 LLM 有天花板
杨立昆对大语言模型的质疑,核心不在“它会不会写得像人”,而在“它是否真的理解世界”。当前主流 LLM 的基本训练目标,是根据上下文预测下一个 token。这个机制非常适合语言生成,却不天然等同于理解、计划和因果推理。

图2:自回归大模型的核心限制示意
因此,很多看似离散的问题其实有同一个根:模型可以输出正确的物理公式,却未必真正理解杯子为什么会摔碎;可以写出漂亮的长文,却可能在复杂推理中前后矛盾;可以模拟专业口吻,却可能在关键事实上一本正经地出错。
▌三、四个硬伤:不是参数不够,而是学习方式不够
第一,是逐 token 生成带来的局部性。模型一步步续写,容易缺少全局目标和稳定规划。长文本、复杂代码、多步骤任务中出现前后矛盾,并不只是“提示词没写好”,也反映出架构本身的限制。
第二,是常识的来源问题。人和动物通过视觉、触觉、行动和反馈获得世界经验,而大模型主要从文字中学习。文字是人类经验的压缩结果,带宽低、抽象高,天然丢失大量真实世界细节。

图3:真实常识来自感知、行动与反馈
第三,是幻觉难以彻底根除。只要目标仍是生成最像样的文本,模型就可能在没有可靠依据时继续补全。对闲聊来说这也许只是尴尬,对医疗、工业、法律等高风险场景来说却可能变成真正的问题。
第四,是离散符号和连续世界之间的错位。现实世界是连续、动态、带有物理约束的系统;token 则是离散符号。用文字统计去逼近现实规律,能覆盖很多表达问题,却很难独自承担真实世界决策。
▌四、世界模型:他押注的不是更大模型,而是另一种智能
杨立昆提出的方向,是让 AI 建立一种内部“世界模型”:它能够感知环境、理解状态、预测后果,并根据目标规划行动。这样的系统不只是回答问题,而是能在某种程度上模拟“如果我这么做,会发生什么”。

图4:世界模型需要形成感知、预测、规划、反馈闭环
这也是他反复强调动物智能的原因。猫狗不会背诵百科,但它们能避开障碍、理解遮挡、预判动作、在物理世界中生存。对杨立昆来说,这些能力才是机器走向更高级智能时必须补上的底层课。
▌五、JEPA:为什么他不迷信生成式路线
为了落地世界模型,杨立昆提出了 JEPA(Joint Embedding Predictive Architecture,联合嵌入预测架构)。它的关键思路不是把缺失内容逐字逐像素生成出来,而是在更高层的抽象表征空间里预测变化。

图5:JEPA 聚焦抽象表征预测,而不是逐像素复刻
这听起来有点抽象,但直觉很简单:人看见一个球滚向桌边,不需要在脑中渲染每一帧像素,也能判断它可能掉下去。JEPA 想学的,正是这种抓住核心变化、忽略无关细节的能力。
▌六、不是 AGI 神话,而是 AMI 路线
杨立昆更愿意谈 AMI,也就是高级机器智能,而不是被资本市场反复包装的 AGI 神话。他的观点是:人类智能并不是无所不能的“通用智能”,而是长期进化出来、适配现实环境的复杂能力集合。
所以,与其幻想一个突然无所不知的超级智能,不如先构建能理解物理世界、掌握常识、进行规划、在真实环境中可靠工作的机器智能。这条路更慢,却也更接近智能本身。
▌七、开源与垄断:他真正担心的风险
在 AI 风险问题上,杨立昆也常常与主流恐慌叙事保持距离。他并不认同“AI 很快自我觉醒毁灭人类”的简单末日论。相比之下,他更警惕少数巨头垄断基础模型和算力资源,进而控制 AI 生态的入口。
这也解释了他长期支持开放研究、开放模型和社区协作的立场。开放并不等于没有风险,但它能让更多研究者参与验证、复现和修正,也能避免最关键的技术只被少数公司握在手里。

图6:AI 的另一场竞争,是开放生态与闭源垄断之争
▌结语:真正的分歧,是 AI 要不要回到真实世界
杨立昆的尖锐之处,不在于他否定大模型,而在于他拒绝把大模型当成智能的终点。LLM 仍然会是重要工具,也会继续改变内容、办公、搜索、编程和交互方式。但如果 AI 要进入机器人、工业控制、医疗辅助、自动驾驶等高风险场景,仅仅会说话远远不够。
真正的智能,必须理解世界。它要知道物体不会因为被遮挡就消失,要知道行动会带来后果,要能在目标、环境和反馈之间不断校正自己。
所以,杨立昆的判断并不是“AI 没有未来”,而是:只靠今天这种文字接龙式 AI,没有未来。下一轮竞争,属于那些能把机器带回真实世界的人。
事实参考
• ACM 2018 Turing Award:https://awards.acm.org/about/2018-turing
• Yann LeCun - A Path Towards Autonomous Machine Intelligence:https://openreview.net/pdf?id=BZ5a1r-kVsf
• Meta AI - V-JEPA:https://ai.meta.com/blog/v-jepa-yann-lecun-ai-model-video-joint-embedding-predictive-architecture/
• Meta AI - Introducing LLaMA:https://ai.meta.com/blog/large-language-model-llama-meta-ai/
• TechCrunch - AMI Labs raises $1.03B:https://techcrunch.com/2026/03/09/yann-lecuns-ami-labs-raises-1-03-billion-to-build-world-models/
• TechCrunch - LeCun predicts a new AI architecture paradigm:https://techcrunch.com/2025/01/23/metas-yann-lecun-predicts-a-new-ai-architectures-paradigm-within-5-years-and-decade-of-robotics/

文章精选:
1.编程时代已终结!ClaudeCode创始人断言:编程就像发短信一样自然,首曝个人最新工作流:自创Sloop循环,单日PR达150!传统SaaS护城河崩掉
