独家观点|物理AI的“Aha moment”卡在哪?伯克利艾伦·杨:缺一个DeepMind式的强化学习突破

独
家
观
点
世界人工智能大会(WAIC)于2024年12月正式推出首份刊物《WAIC UP!》,这是一部「AI时代进化指南」。我们邀请全球AI及跨领域的先锋力量,借由他们的独特视角,针对AI争议问题,带来一些反直觉、非共识的思辨观点。
本期嘉宾是加州大学伯克利分校研究科学家艾伦·杨。他在硅谷待了20年,做过AR/VR首席设计师,带学生拿过自动驾驶世界冠军。
Allen Yang
艾伦·杨
加州大学伯克利分校电子工程与计算机科学系研究科学家
FHL Vive增强现实中心创始执行主任
伯克利AI竞速项目主席
Hitch Open世界AI竞速锦标赛裁判委员会主席
他主导AR/VR、元宇宙及赛车自动驾驶研究,创立相关学位课程。他发起伯克利AI赛车队,2025年率队获CES自动驾驶挑战赛头对头超车冠军。另外,作为硅谷连续创业者,他曾任两款AR/VR智能眼镜首席设计师,拥有20余项专利。
以下为Allen独家观点的部分摘录:
物理AI的“Aha moment”:比大语言模型难在哪?

“物理智能犯错,代价比大语言模型高得多。”
/ 01
ChatGPT为什么能那么快火?
“因为它站在了巨人的肩膀上,”艾伦·杨说,“之前的互联网,已经把人类的语言知识全部数字化了。它只需要做个爬虫去爬互联网,就能获得这些知识。”
但物理AI没有这个“巨人”。
“任何人炒了个菜、开了辆车、扫了个地,不会把自己的动作数字化,然后放在互联网上让你去爬。而且物理空间还涉及隐私问题。”
所以,物理AI的突破点不在模型,而在训练方法。
“我们需要一个像DeepMind那样的强化学习突破——不用监督学习,通过两套AI系统从小白开始左右互搏,就能找到比人类更优的策略。”
而他选择用赛车来做这件事。
“当我们的车开到120迈的时候,你必然要问:这车开160迈的时候安全吗?反过来,如果我知道它开到160迈不安全,那我也不会让家人在出行时速120公里的时候开这辆车。”
物理智能犯错,代价比大语言模型高得多。大模型说错话,你笑一笑就忘了。自动驾驶在你小区里撞了,你一辈子忘不了。
在极限边缘测试AI,不是为了比赛,而是为了让消费者拿到更安全的产品。
中国在物理AI时代的王牌:供应链
“历史不会重复,但总是押韵。”
/ 02
“过去二三十年,我们已经看到了好几轮这样的节奏。iPhone设计在加州,但产线在中国;无人机曾经美国领先,后来大疆出现了;电动汽车也一样。物理智能和机器人,很可能也是这个趋势。”
但光有硬件不够。
“我们的汽车自动驾驶,不只要知道在中国怎么做,还要知道在欧洲、美国怎么做。各个国家的人怎么开车,背后是更深层的文化差异。机器人也一样——中国、英国、德国、墨西哥的妈妈分别是怎么带孩子的?”
他提出一个“蓝海”:
物理智能公司需要重视国际文化差异,把人类背后的情感纽带,像互联网一样重新连接起来。之前,因为互联网,我们的语言和文字已经连接起来了。但我们的文化、我们的情感,目前很大一部分还是切割的。希望在物理智能的时代,我们能重新建立起新的纽带。
一个科学家的“非共识”:失败是最好的教材
“大自然没有监督学习。”
/ 03
赛道上,一辆自动驾驶赛车冲出弯道,轮胎卷起尘土,车身划出失控的弧线。在大多数人眼里,这是失败。但在伯克利AI竞速项目主席艾伦·杨眼中,这是他最珍贵的教材。
“大自然没有监督学习,”他说,“大象妈妈永远不会给小象写一本课本,然后用梯度下降去摧残自己的孩子。动物世界里,新生的婴儿、小象,每一步都是摔跤的。没有摔跤,就没有站起来的那一刻。”
他有一个独特的思维方式:用训练AI的方式来理解人类学习,又用人类学习的方式来理解AI。
AI的“预训练” = 孩子的童年
AI的“监督学习” = 填鸭式教育(给标准答案,模仿、重复)
AI的“体验式学习” = 孩子学走路(在摔跤中估算自己的价值函数)
基于这个框架,他得出了一个“非共识”判断:
真正的智能,从来不是在安全的环境里被教出来的,而是在失控的边缘自己长出来的。
Open Claw为什么是“病毒”?
“前提是,你得知道‘验证’本身意味着什么。否则,风险太大了。”
/ 04
所有人都在讨论“怎么装龙虾”,但没人问“这东西验证过吗”?
艾伦·杨说得直白:“我不会用。Open Claw本质上就是个病毒。‘病毒’是个中性词,有的病毒能治癌症,只要它能精准找到你的痛点、解决你的痛点,它就是癌症杀手。但它也有未知的风险。现在Open Claw还没有经过充分验证,它去主动调用你的电脑,风险是比较大的。”
再酷的功能,没有验证,就是风险。不是不能试,但得知道“验证”本身意味着什么。
他提醒:不要只看到“它能在你睡觉后还帮你干活”,要看到背后的安全风险。
AR/VR为什么还卡在“一眼假”?芯片+硬件+视觉显示器是通关门票
“无论打造多好的产品,一定要迭代式开发。”
/ 05
产品市场fit的三个词:Product(工程师想做的)、Market(消费者认不认可的Aha moment)、Fit(值多少钱)。AR/VR折腾了这么多年,还没真正fit。
作为AR/VR领域的早期研究者,艾伦·杨对这项技术的判断很冷静:“任何人把AR/VR放眼前,一眼就能看出来是假的。什么时候算到了‘Aha moment’?你戴上装置以后,分不出来虚拟场景到底是数字生成的,还是眼前是真实场景。”
解决痛点需要新的芯片、新的硬件加速,和高清晰的视觉显示器做深度的绑定,要做纳秒级、毫秒级的优化,目前还没人跨过去。
艾伦·杨的忠告是:对无论打造多好的产品,一定要迭代式开发。不要憋大招,不要想一步登天。
读博还是工作?先想清楚时间花在哪
“学术界的思维方式永远是跳跃性的。产业界要的不是跳跃式思维,而是迭代性的开发能力。”
/ 06
“现在的学生,最大的痛苦就在于找工作,”艾伦·杨直言,“十年、二十年前,只要你是顶尖工科学校毕业,基本是铁饭碗。但现在不一样了。AI出来了,它不但不需要那么多新鲜血液去滋养,甚至可能把老的树干也替换掉。”
他经常被学生问一个问题:要不要读博?
“很多学生看到AI火了,看到做AI的都是博士,就得出结论:我也要读博。但问题在于,你要花五年时间。这期间,你在学术界用8块GPU算未来5年、10年的问题,但压根没登上今天的列车。等博士读完,AI早就不是今天的AI了。”
他的建议很朴素:做自己喜爱的事。
“如果你喜爱去公司里工作,直接就去公司。虽然会很痛苦,但至少是痛并快乐着的。如果读博只是为了换一张现在心仪职位的入场券,五年后等你走出来,那个位置可能早已不属于这个时代。”
可在微信小店购买纸刊
也可扫码在线阅读

扫码进入#06期《WAIC UP!》
解锁10篇AI时代最实用的解决方案
Hello:
世界人工智能大会(WAIC)推出首份刊物《WAIC UP!》,一部「AI时代进化指南」。
WAIC UP! WAKE UP MORE!
我们邀请全球AI及跨领域的先锋力量,共同释放思考的力量与智慧的主张,旨在唤醒更多人,探究关乎技术跃迁、自我边界和未来文明的无限可能。
准备好!释放你的思考,觉醒你的行动,与我们一同探究那些尚未显现的可能性,勾勒以人为中心的未来智慧文明全景图!









