“哲学前沿“课程第八讲回顾 | 沈榆平:模仿游戏——机器智能定义之争

2021年4月21日19:00,中山大学哲学系2021年研究生哲学前沿讲座系列第八讲《模仿游戏——机器智能定义之争》在锡昌堂801举行,主持人为哲学系陈少明教授。

在当前信息计算、移动互联和大数据技术高速发展的时代,人们的生活不可避免地与许多被称为“智能”的设备、应用或服务所覆盖。这些技术产品是否可认为真正具备“智能”?主讲人沈榆平老师认为,一种思考进路是从机器的概念展开对“智能”的探讨和分析,从而达到对“智能”本质更深刻的认识和理解。讲座以此为线索,分三个环节依次展开。

 

1.机器与计算

1

沈老师首先把机器解释为一种具有稳定结构的系统,由若干不同的状态和改变这些状态的操作组成。比如,一个灯泡具有“亮”和“灭”两个状态(分别记作“是”、 “否”)及开关操作“按”(记为符号“1”)。那么,“按“将灯泡状态从“灭”转换成“亮”,亦可从“亮”转换成“灭”。注意到,按一次,灯亮;按两次,灯灭;按三次,灯又亮… 可用符号记为“1 -->是,11 -->否,111 -->是,1111 -->否…”。若把符号1,11,111等看成输入,“是/否”看成输出,那么从计算的角度,这个灯泡就是一个判定奇偶性的机器! 因为所有奇数个1的输入,机器都回答“是”,所有偶数个1的输入,机器都回答“否”。事实上,具有这种类似结构的机器被称为有穷自动机,它们已经可判定或计算许多有趣的数学问题。

1936年前后,阿兰•图灵(Alan Turing)提出了图灵机(Turing Machine)的概念。这是一种能力得到扩展的自动机,它增加了一条可擦写符号的纸带(供输入/输出/计算,可无限使用),机器根据指令操控读写头对纸带进行对应的读写、移动并切换机器的状态。事实上,这种机器不仅是物理上可实现的,而且准确刻画了哥德尔的“能行过程“概念。

现在我们知道图灵机是人类能实际制造的可计算性(computability)最强的自动机器。任何现代计算机或程序都可本质上还原成一台功能等价的图灵机,只不过现代计算机运算速度更快,输入和输出手段更为丰富而已。另一方面,人类也证明了存在图灵机不可解(unsolvable)的任务,如一阶逻辑公式的有效性判定问题等。

从机器和计算的角度看,现实世界中人类设计的机器,其可计算性不会超过图灵机;同时,不可解问题的存在也为机器的能力划上了一条绝对不可超越的上界。

 

2.模仿游戏

1950年图灵对“机器是否能思考?(Can machines think?)”这一问题进行了探讨,他构思了一个称为“模仿游戏”的思想实验:机器A、人类B和人类C分别处于区隔的房间,互相不能直接对话或接触,但C和A、C和B之间可通过书写传递信息。游戏的设定是人类C通过一段时间的纸面交流来判断A和B的真实身份,即C须回答A与B哪个是机器,哪个是人类。若机器A把这个游戏玩得足够好,使得C无法正确判断结果,那么我们通常也称A通过了“图灵测试”并认为A有“智能”。“模仿游戏“已经在科学哲学、心灵哲学、计算机科学等领域被深入讨论并认为是一种可评判机器“智能”的标准。

如果从模仿游戏的角度来分析深度学习、模式识别和自然语言处理等领域,不难观察到大多数此类应用虽然取得不少突破,但与“模仿游戏”并没有很直接的关联。这些技术主要基于机器学习,即通过数据和经验的使用来自动改善分类或预测效果的算法,本质上可以理解为一种统计推理。这种推理的方式缺乏对常识的处理,导致很多简单的任务出现反常结果。比如带有微量噪音的图像被识别为完全无关的对象、机器生成的自然语言对话毫无逻辑等等。此外,一些通过人机对话方式进行问题解答/任务执行的程序,如IBM的Waston、Apple的Siri等可处理直白问题(plain question),但对含有逻辑推理的简单问题也似乎无能为力。

可见,要进行完美的“模仿游戏”,机器需要常识推理(commonsense reasoning)的能力—这恰恰是人类擅长而机器不擅长的任务。

 

3.更好的模仿游戏?

模仿游戏虽然涵盖常识推理测试,但仍然有进一步精简和改良的空间。一些批评者指出,首先,游戏名为模仿,但实质上是设定机器的假身份用于“欺骗”人类玩家,这是否能准确定义“智能”?其次,游戏可包含许多“话术”,如引开论题、故作高深等,这是否是一种合理的测试?再次,人类玩家水平不一,模仿游戏结果的评判难以明确,等等。

Hector Levesque等人主张用“威诺格拉德模式挑战”(Winograd Schema Challenge,WSC)作为另一种替代模仿游戏的测试方法。考虑以下WSC问题:

  • 鳄鱼爬不过栏杆,因为它太矮了。请问谁太矮了?

  • 答案:鳄鱼。

  • 鳄鱼爬不过栏杆,因为它太高了。请问谁太高了?

  • 答案:栏杆。

一个WSC问题包含两个同类型的名词(“鳄鱼/栏杆”),一个指向两名词之一的代词(“它”),以及一对互为替换的形容词(“矮/高”)。答案要求确定指示代词指向的名词,并且当切换形容词的时候,答案也随之切换。

又如:

  • 王亮在李军的后面看不见舞台,因为他太[矮/高]了。

  • 谁太[矮/高]?答:[王亮/李军]。

WSC问题的优势在于:(1) 答案明确(一定是指向两名词之一且无异议);(2) 很难使用统计推理的方式解决(两个名词和形容词之间没有明显的统计相关);(3)很难使用搜索大数据库的办法解决(不是直白知识)。此外,回答WSC显然需要常识推理的能力、它还是一种人类可轻易回答而机器难以回答的问题。从上述分析看,将WSC视作一种更好的模仿游戏是一个合理、可行的方案。

·

整体上,本次讲座讨论了机器的计算本质、对“智能”的不同理解以及模仿游戏的新发展等问题。演讲结束后,主持人陈少明老师进行了简明扼要的总结,并引用荀子学说指出人类具有理性、合作等优势,同学们也就人工智能发展等问题与沈老师进行了热烈的交流。

                                                    (供稿:赖冠成)

扫描此二维码分享