王怀民:主体性的回归——图灵思想的启发之二 | CCCF精选

图灵给出“图灵测试”作为判断机器是否具有智能的标准,完全接受了人的主体性。图灵曾经提出谕示(oracle)图灵机模型,其现实意义在于它为“人在系统中”的动态计算提供了开放架构。虽然没有出现通“神”的计算机,但是我们看到通“人”的计算系统——互联网,这个系统提供的服务已经超越了经典图灵可计算的范畴,让每一个人通过互联网看到了人类群体智能激发与汇聚所产生的巨大力量,也无意中为大数据驱动的机器学习提供了数据基础,助推了大语言模型的诞生,推动人类信息化的进程进入智能化的高级阶段。本文认为,大语言模型成功的现实意义在于人类进入了用自然语言实现人机协作的新时代,人类主体性达到新高度。此时此刻,人类不应该怀疑甚至丧失人的主体性。

图灵可计算理论是人类寻求确定性的集大成者,既触达了确定性的边界,也开启了超越确定性的探索,其中的一个可能未被广泛认知的超越,是人从系统外回到系统中,我将这一历程称为人的主体性回归。这是图灵思想给我们带来的第二个启示。
1936年以后的图灵一直在努力超越图灵可计算的边界,并思考机器是否可以具有智能。1938年,图灵在其导师丘奇的指导下完成了博士学位论文,获得美国普林斯顿大学数学博士学位。在博士论文中,图灵提出了谕示(oracle)图灵机模型,其核心思想是当图灵机在执行过程中出现无法决定下一个动作的状态时,可以寻求系统之外“神”的启示,按照谕示继续执行。我们没有看到一个通“神”的计算机的诞生,但是我们看到通“人”的计算系统的到来,看到人的主体性与计算机系统融为一体的力量,其中最具代表性的“人在系统中”的计算系统,就是今天的互联网系统,这是改变了人类文明进程的人机协作系统,这个系统的能力已经超越了经典图灵可计算的范畴。
今天主流的计算机系统几乎都是人机协作系统,其基础依赖于事件驱动的计算机操作系统,该系统在外部事件驱动下执行,没有终止状态。如果没有外部强制性的终止干预,计算机系统始终处于等待外部事件的状态,或处理事件的状态,这些外部事件包括用户通过人机交互信号发出的请求,这些交互信号可能是鼠标点击信号、网络通信信号、触摸屏滑动信号,甚至是人类自然语言的语音信号。这是我们今天已经习以为常的计算机使用方式,是系统持续在线的基础,但是我们可能没有意识到,这种计算机系统的运行方式已经超出了经典图灵可计算的自动执行“算法”范畴。
以我们熟悉的互联网推荐算法为例,这里的算法已经不是经典图灵可计算意义下的确定性算法,而是一个无终止状态的服务过程,虽然我们按照业界的习惯,仍然称其为算法。首先,推荐算法所作用的资源搜索空间是开放的、持续生长的网络资源(如文本、图像、商品等)。这些资源被互联网上的广大用户或工具持续创建并加入系统中,再被算法编织进语义网络。同时,算法所作用的用户兴趣偏好空间也是开放的、变化的,甚至是要素不一致的,伴随用户对推荐结果的反馈不断调整。也就是说,推荐算法作用的问题空间不是一个确定性的有限编码,而是一个持续变化的编码过程。其次,推荐算法的推荐结果并不是唯一的,甚至对于多次相同的推荐请求,可能获得不一样的推荐结果,也就是说,推荐算法并非经典意义下的可计算函数。最后,推荐过程可能存在不确定性,其输出结果具有随意性,这种随意性源于算法对用户意图的多义理解以及语境动态变化所导致的概率性推断。推荐算法在面对开放环境时,必须权衡探索与利用的关系,在未知内容中寻找潜在相关性的同时,持续优化已有认知路径。因此,其决策过程并非基于静态规则的演绎推理,而是依赖数据驱动的归纳学习,通过不断试错来逼近用户兴趣偏好的演化轨迹。这一机制使得推荐行为本质上成为一种适应性响应,而非封闭系统的确定输出。
从推荐系统中我们注意到,图灵机不仅可以自动执行传统的图灵可计算问题,还能够执行无停机状态的计算过程。前者的执行无需人的干预(即人在系统之外),后者的执行依赖人机协作(即人在系统之中);前者的意义体现在人设计的确定性算法之中,后者的意义恰恰在于“人在系统中”的反馈。这种“人在系统中”的计算活动已经超出了经典图灵可计算意义上的“算法”,也超出了其他可构造、可编码的计算系统(例如递归函数系统、Post系统、λ演算系统)的问题域。所以,我们不能简单说,图灵机与递归函数等价;我们只能说,二者在经典图灵可计算的问题域中是等价的。图灵机能够处理的问题不限于图灵可计算问题,例如推荐系统这样的“人在系统中”的有意义的不停机问题也能处理,这正是图灵机不同于其他可计算模型而更具现实意义的原因所在。
我们可以认为,谕示的图灵机模型的现实意义在于它为“人在系统中”的动态计算提供了开放架构——停机与否不再是判定计算是否有效的唯一标准,人机协作能力的演化与目标调适构成其现实运行的核心逻辑。这种架构使图灵机成为人机协同演化的理想载体:用户反馈实时重塑计算路径,系统在运行中生成新目标。因此,我们看到了互联网的持续成长,看到在互联网上形成的开源软件生态、维基百科生态、众包计算生态等人机协作系统。人类智能成为互联网系统中最活跃的力量,互联网系统成为“人在系统中”最具代表性的存在,我们每一个人都可以通过互联网看到人类群体智能激发与汇聚的巨大力量,看到了人机协作、相互赋能的潜移默化学习演化过程。
人回到计算系统中,是人类社会进入以计算机为核心的信息化进程的重要标志,从某种意义上讲,人类信息化的进程就是人机协作不断深化的历史进程。人类社会的信息化已经经历了数字化和网络化2个阶段,正在进入智能化的高级阶段。摩尔定律驱动的集成电路指数增长模式使得数字化成本持续下降,进而使得人类的生产、生活和学习行为持续被数字化;宽带(移动)互联网技术的普及实现了人−机−物越来越广泛的联结,使得人类的社会协作行为持续被数字化,云计算技术的广泛部署实现大数据的汇聚与处理。这个过程潜移默化,为大数据驱动的机器学习提供了数据基础,助推了大语言模型的诞生,推动人类信息化的进程进入智能化的高级阶段。我们看到了人类文明成果如此高效地浓缩在大语言模型之中。
今天的智能化还是信息化中的智能化。虽然我们对信息化后的智能化还知之甚少,但是,我们不能因为大语言模型在理解自然语言方面的巨大进步,以及人们对通用人工智能(artificial general intelligence, AGI)和超级人工智能(artificial superintelligence, ASI)的期待,再次怀疑甚至丧失人的主体性。大语言模型成功的现实意义在于人类进入了通过自然语言实现人机协作的新时代,人类能力不是被人工智能替代或超越,而是人机协作能力将实现新飞跃。
如果说,1936年图灵是在构造不可判定问题时无意中回答了什么是(可)计算的问题,那么,1950年前后,他是有意识地关注什么是智能、机器是否可以具有智能的问题。其思想集中反映在他1950年发表在哲学刊物《心》(Mind)上的文章“Computing Machinery and Intelligence”(《计算机与智能》)中。文中他给出了著名的“图灵测试”,成为影响深远的判别机器是否具有智能的“标准”。与传统西方科学界寻求“客观”确定性的标准不同,图灵测试是一个十分“主观”的不确定的标准,是一个“人在系统中”的标准,更是“人在系统上”的标准。所谓“人在系统中”的标准是指把机器回答人用自然语言提出的问题与人回答自然语言问题的效果比较作为标准,所谓“人在系统上”的标准是指把效果比较评判也交给了人。这样的标准似乎非常不客观、不确定,但体现了图灵对人的主体性的关注和接受,人类才是“什么是智能”这个问题的最终评判者,在什么是智能的问题上,图灵彻底回归了人类的主体性。图灵测试的挑战实际上迫使人类置身于“自指”的游戏中:用人类智能评判人类智能。好在当时人类已经发明了通用可编程数字电子计算机,人类终于有了模仿人类智能的高级“客体”,人类这个智能主体可以通过“折腾”计算机来研究智能问题,从而暂时避开了“自指”可能产生认知困境。1956年以后,“人工智能”这一术语开始在学术界传播。
图灵当年为什么没有选择算术运算、定理证明、棋类博弈,而是选择自然语言理解作为智能测试的标准?这可能是因为在算术运算方面,当时的计算机已经超过人类,或者定理证明存在不可判定性,或者棋类博弈就是有限空间搜索。我理解,更可能是因为,图灵遵循了当年学术界的普遍共识,即人类能够从动物界脱颖而出成为地球的主宰,是因为人类能够使用语言文字交流协作,使用语言文字是人类智能区别于动物智能的最高表现形态,其他人类智能行为(例如算术运算、定理证明、棋类博弈)都是自然语言理解的特殊形态,人类就是一个物理符号处理系统。这可能也是符号主义学派在人工智能研究中长期占据主导地位的重要原因,也是自然语言理解从人工智能概念确立开始就是最重要的人工智能研究方向的原因;这可能也是大语言模型的成功给人们带来如此震撼的原因所在。相较于对AGI或ASI的预期,我认为,大语言模型带给我们的更深刻启示在于数据驱动的深度学习可能带来人类建模方法的革命。我们依然能够从1939年图灵与维特根斯坦关于悖论的对话中获得启发。
王怀民
CCF会士,CCF开源发展技术委员会主任。中国科学院院士。国防科技大学教授。主要研究方向为分布计算、软件工程、人工智能。
whm_@163.com
确定性的边界——图灵思想的启发之一 | CNCC特邀报告




点击“阅读原文”,加入CCF。

