艾伦·图灵(Alan Turing)是机器学习的先驱,他的工作继续塑造着一个关键问题:机器能思考吗?
当艾伦·图灵(Alan Turing)将注意力转向人工智能时,世界上可能没有人比他更适合这项任务。他的论文“计算机与智能”(1950年)仍然是该领域最常被引用的论文之一。然而,图灵英年早逝,在很长一段时间里,他的大部分作品要么被保密,要么无法进入。因此,从他身上可以学到一些重要的教训,包括人工智能的哲学基础,这也许并不奇怪。
图灵对这个话题的思考远远领先于其他人,部分原因是他早在1936年就发现了现代计算机的基本原理——存储程序设计(比第一台现代计算机实际设计早了整整12年)。图灵刚刚(1934年)在剑桥大学国王学院完成了数学的第一学位,当时他的文章“论可计算数(On Computable Numbers)”(1936年)发表 - 历史上最重要的数学论文之一 - 其中他描述了一种抽象的数字计算机,今天被称为通用图灵机。
几乎所有的现代计算机都是以图灵的想法为蓝本的。然而,他最初构思这些机器仅仅是因为他看到参与计算过程的人类可以用一个人进行类比,并且是以一种对数学有用的方式进行类比。他的目标是定义原则上可计算的实数子集,独立于时间和空间。出于这个原因,他需要他想象中的计算机能够发挥最大的功能。
艾伦·图灵(Alan Turing)于1951年由Elliott和Fry拍摄。
为了实现这一目标,他首先设想有无限的磁带供应(想象机器的存储介质)。但最重要的是,他发现了一种设置机器中央机制的方法,该方法必须能够以无限多种不同的方式进行设置,以响应它在磁带上扫描的内容来做一件事或另一件事,以便能够模仿中央机制的任何可能设置。这种方法的基本要素是存储程序设计:通用图灵机可以模仿任何其他图灵机,只是因为 - 正如图灵所指出的那样 - 中央机制的基本编程(即机制的设置方式)本身可以存储在磁带上,因此可以修改(扫描,写入,擦除)。因此,图灵指定了一种可以计算任何实数的机器,实际上可以计算任何东西,任何可以根据给定指令集自动扫描,打印和擦除的机器都可以计算;此外,在某种程度上,在计算过程中与人类的基本类比是可以计算的,计算任何人类可能计算的东西。
重要的是要理解,存储程序设计不仅是现代计算最基本的原则——它还包含了对机器学习局限性的深刻洞察:即,这样的机器原则上做的事情,原则上是它自己无法理解的。图灵很早就看到了这一含义及其实际的潜力。在存储程序设计首次在实际机器上实现之前的几年,他很快对机器学习问题产生了浓厚的兴趣。
正如图灵的剑桥老师、终身合作者和计算机先驱马克斯·纽曼(Max Newman)所写的那样:“他对”通用“计算机的描述完全是理论目的,但图灵对各种实际实验的浓厚兴趣使他甚至对在这些线路上实际构建机器的可能性感兴趣”。
在第二次世界大战中,图灵了解了高速电子开关(使用真空管)的进步,并见证了第一台功能齐全的电子数字计算机Colossus的诞生,该计算机从1944年初开始被英国密码学家使用。然而,Colossus没有将其基本编程存储在内部,并且通常远非通用的 - 或者用现代术语来说,“通用” - 计算机。相反,为了使其执行少量不同任务中的任何一项,首先必须使用各种插头和开关手动对机器进行编程。但在 1945 年 6 月,德国投降仅几周后,图灵就被英国国家物理实验室聘用,领导其通用计算机的电子版的开发。他在年底前完成了一项可行的提案,该提案代表了电子存储程序通用数字计算机的最完整规范,包括对电子硬件需要如何设计的非常详细的描述。在三年内,图灵的提议导致了第一台可操作的现代计算机的出现。
根据他的战时同事的说法,图灵在1945年之前的一段时间内已经认真考虑过机器智能的可能性,特别是机器学习和启发式搜索。在他1945年的提案中,他简要指出:“有迹象表明......有可能使机器显示智能,冒着偶尔犯严重错误的风险”。第二年,1946年,他将大部分精力投入到编程的开创性研究上,他正确地认为这是未来发展的关键。1947年2月,他在伦敦数学学会(London Mathematical Society)上发表了演讲,这可能是第一次公开发表关于人工智能主题的科学演讲。
他首先向听众讲述了通用图灵机。他解释说,正在开发的东西“可以被视为这种相同类型机器的实用版本”,因此这些机器可以“完成人类计算机可以完成的所有工作”。他进一步解释了这些机器将来如何用于数学研究,以及它们对数学家工作的性质和数量可能产生的影响。“这个话题,”他指出,“自然会引出一个问题,即计算机在原则上模拟人类活动的可能性有多大。他非常明确地指出,尝试模拟哪种人类活动最重要。“我们想要的是一台可以从经验中学习的机器,”他说。
图灵同样清楚这是可以做到的,以及如何做到的:“让机器的指令改变自己的可能性为此提供了机制。换句话说,存储程序的设计使之成为可能。“但是,”他补充说,“这当然不会让我们走得太远。毕竟,编程当时甚至还处于起步阶段(诸如“学习算法”之类的术语还不存在),更不用说他所指的机器(现代计算机)才刚刚被制造出来。
他所有的哲学著作都只有概念清晰的工具性目的。
图灵热衷于解决一个相关问题本质上是纯粹的哲学问题。这可能是他余生中最困扰的问题。正是同样的问题引发了他的人工智能哲学中最广泛讨论的概念,即现在被称为图灵测试。看到图灵在这方面的思想演变,无论是在他著名的测试制定之前还是之后,都将帮助我们至少避免对图灵试图做的事情的最粗糙但太常见的误解。
“有人可能会说,在具有智能的机器的概念中存在一个根本的矛盾,”这是他在演讲中开始最后反思的方式,最终导致他“呼吁'机器公平竞争'”。他用一个小小的思想实验说明了他的想法,这个实验可以被视为图灵测试的早期先驱:
让我们假设我们已经设置了一台具有某些初始指令表[即程序]的机器,这些表的结构使得这些表有时可能会(如果出现充分的理由)修改这些表。人们可以想象,在机器运行了一段时间之后,指令会在所有识别之外发生变化,但仍然如此,以至于人们不得不承认机器仍在进行非常有价值的计算。它可能仍然获得机器首次设置时所需类型的结果,但以更有效的方式。
在评论此方案时,他接着补充道:
在这种情况下,人们不得不承认,当机器的原始指令被放入时,机器的进展是没有预见到的。这就像一个学生从他的主人那里学到了很多东西,但通过他自己的工作增加了更多。当这种情况发生时,我觉得人们有义务将机器视为智能的展示。
图灵知道,无论他或其他人对这种情况有什么感觉,都不如机器智能是否真的可能重要。但他也知道——以及所有人——在基本层面上的概念清晰,例如通过哲学反思来实现的概念清晰,对于朝着正确方向的任何重大科学进步都是至关重要的。可以说,他所有的哲学著作都只有这种概念清晰的工具性目的。当然,哲学和科学(或者更一般地说,基础科学和应用科学)这两者以这种方式齐头并进,这始终是他作品的特征。在演讲中,他从上面的段落中立即可以看出这一点:“一旦人们能够提供相当大的内存容量,就应该有可能开始对这些线路进行实验。
Turing对实际实验的浓厚兴趣是他一直主张开发具有最小复杂硬件架构的高速大内存机器(他后来称之为子机器)的原因之一,以便为编程提供最大的自由度,包括机器的重新编程本身(即机器学习)。因此,他解释说:
在这次演讲中,我花了相当多的时间讨论存储问题,因为我相信提供适当的存储是解决数字计算机问题的关键,当然,如果要说服他们展示任何真正的智能。
在同一时期的一封信中,他写道:“我对产生大脑动作模型的可能性更感兴趣,而不是对计算的实际应用。由于他对计算技术发展的真正科学兴趣,图灵很快就对国家物理实验室正在进行的工程工作感到沮丧,这项工作不仅由于组织不善而进展缓慢,而且在速度和存储容量方面也远不如他想要的那么雄心勃勃。1947年年中,他申请了12个月的假期。实验室主任查尔斯·达尔文(查尔斯·达尔文的孙子)支持这一点,请求得到了批准。在那年7月的一封信中,达尔文这样描述图灵的原因:
他想将他在机器上的工作进一步扩展到生物学方面。我最能描述它的方式是,到目前为止,这台机器已经计划用于相当于大脑下部的工作,他想看看一台机器能为高等部分做多少工作。例如,可以制造出一台可以通过经验学习的机器吗?
这项研究确实专注于学习问题,其结果确实是一个名为“智能机械”的开创性打字机。哲学家杰克·科普兰(Jack Copeland)是新西兰图灵计算历史档案馆(Turing Archive for the History of Computing in New Zealand)的馆长,他将这篇论文描述为人工智能的第一个宣言,就我们目前的历史知识而言,这似乎是准确的。最终版本写于1948年。然而,它在实验室并不受欢迎,据报道,达尔文嘲笑它是一篇“小学生的文章”,并认为它不适合发表。直到1968年,它一直没有出版,随后几乎没有受到关注。
“与人脑的类比被用作指导原则”
然而,这篇论文预测了基于逻辑和连接主义(神经网络等)的人工智能方法中的许多重要思想和技术。特别是,图灵详细描述了一个人工神经网络,该网络可以使用强化学习(“奖励”与“惩罚”反馈等)和遗传算法进行训练。他在论文末尾的总结给人一种开创性的特征:
讨论了使机器显示智能行为的可能方式。与人脑的类比被用作指导原则。有人指出,只有提供适当的教育,才能实现人类智能的潜力。调查主要围绕应用于机器的类似学习过程展开。无组织机器的概念被定义了,并且认为婴儿的人类皮层具有这种性质。给出了这种机器的简单例子,并通过奖励和惩罚的方式讨论了它们的学习过程。在一种情况下,学习过程是通过...
图灵在研究离开后再也没有回到国家物理实验室。相反,在1948年5月,他加入了他的朋友曼彻斯特大学的纽曼计算机实验室,不久之后,世界上第一台电子存储程序通用数字计算机小型实验机(俗称曼彻斯特婴儿)运行了它的第一个程序。
在他生命中剩下的六年时间里,图灵大部分时间都在继续他的人工智能研究。在完成扩展的曼彻斯特Mark I机器和随后的Ferranti Mark I(世界上第一台商用现代计算机(由Ferranti Ltd制造))的编程系统后,图灵于1951年初开始在Ferranti上进行实验。他计算生物生长模型的早期结果发表在论文“形态发生的化学基础(The Chemical Basis of Morphogenesis)”(1952年)中,该论文代表了对人造生命研究的重要早期贡献。
他写的另一篇论文描述了一种使用基因搜索的国际象棋学习算法,这很可能是他在1945年的提案中写下来时所想到的:
有迹象表明...有可能使机器显示智能,冒着偶尔犯严重错误的风险。通过跟进这一方面,机器可能会下非常好的国际象棋。
但是,特别是,图灵继续他在人工智能哲学方面的工作,并积极尝试推进有关该主题的学术和公共话语。例如,1949年10月图灵、纽曼、神经外科医生杰弗里·杰斐逊(Geoffrey Jefferson)和迈克尔·波兰尼(Michael Polanyi)(当时是曼彻斯特的社会科学教授)之间关于“心灵和计算机”的哲学研讨会进行了几分钟的讨论。第二年,图灵的论文《计算机与智能》发表。此外,在1950年代早期,他至少出现在三个BBC广播节目中。虽然没有已知的录音,但这些文字版于2004年出版。第一个是题为“智能机械,异端理论”的简短演讲,可能于1951年首次播出,其中他声称的目标是通过解释和反思强化学习技术来质疑普遍持有的信念“你不能制造一台机器为你思考(You cannot make a machine to think for you)”。
第二个是关于“数字计算机能思考吗?(Can Digital Computers Think?)”这个问题的简短演讲,图灵在其中简要介绍了存储程序计算机的普遍性,然后提出了以下论点:
如果任何机器都可以被恰当地描述为大脑,那么任何数字计算机都可以这样描述......如果接受真正的大脑...是一种机器,我们的数字计算机经过适当编程,将表现得像一个大脑。
然而,他指出,如果这是“编程机器思考”的过程所要求的,那么这样做就像写一篇关于遥远星球上家庭生活的论文,而这个星球上只是已知存在(图灵当时的例子是火星上的家庭生活)。“事实是,”他继续解释说,“我们对它知之甚少(如何对机器进行编程以使其像大脑一样运行),而且研究也很少。他补充说:“我只想说,我相信这个过程应该与学习过程有密切的关系。
模仿游戏已经达到了预期的目的;它也从根本上被误解了
图灵参加的第三个也是最后一个节目(1952年首次播出)是与纽曼和杰斐逊的讨论,由剑桥哲学家R B Braithwaite主持,关于“自动计算机可以被称为思考吗?(Can Automatic Calculating Machines Be Said to Think?)”首先,与会者一致认为,试图给思维一个一般的定义是没有意义的。然后,图灵引入了“模仿游戏(imitation game)”或图灵测试的变体。在他1950年的论文中,他说他正在引入模仿游戏,以便用一个“与它密切相关并用相对明确的单词表达”来取代他正在考虑的问题 - “机器能思考吗?(Can machines think?)”该论文的游戏版本稍微复杂一些,由一名人类法官试图确定两名参赛者中的哪一名是人类,哪一台是机器,仅基于使用打字短信进行远程通信,这名人类试图帮助法官,而机器假装是人类。图灵说:
“机器能思考吗?(Can machines think?)”这个问题应该被“有没有可以想象的数字计算机在模仿(人类)的游戏中表现良好?”
虽然仅凭它的名气就证明了模仿游戏已经达到了预期的目的,但它也从根本上被误解了。事实上,图灵在人工智能方面的工作的价值传统上被哲学家和计算机科学家都贬低了,对其目的进行了各种歪曲的解释。例如,在一篇颇具影响力的批评中,哲学家约翰·塞尔(John Searle)在1980年抱怨说,“图灵测试是典型的传统,即不知羞耻的行为主义”(也就是说,它将心理学简化为对外在行为的观察),而计算机科学家斯图尔特·罗素(Stuart Russell)和彼得·诺维格(Peter Norvig)则在一章中写道::
很少有人工智能研究人员关注图灵测试,他们更愿意专注于系统在实际任务中的表现,而不是模仿人类的能力。
但重新审视1950年的论文就会发现,图灵的目标显然不仅仅是定义思维(或智力)——与塞尔等哲学家倾向于解读他的方式相反——或者仅仅是像计算机科学家经常理解的那样,将这个概念付诸实践。特别是,与塞尔和他的同类相反,图灵清楚地意识到,机器在模仿游戏中表现良好既不是思维或智力的必要标准,也不是足够的标准。以下是他解释他在广播讨论中提出的类似测试的方式:
你可以称它为测试,看看机器是否思考,但最好避免回避这个问题,并说通过的机器是(比方说)“A级”机器......我的建议是,这是我们应该讨论的问题。这与“机器会思考吗”不同,但它似乎足以满足我们目前的目的,并提出了大致相同的困难。
这段话,以及图灵关于人工智能哲学的其他著作和公开演讲(包括上面描述的所有文章),几乎没有受到关注。然而,总而言之,这些作品清楚地说明了他制定模仿游戏的主要目标是什么。例如,他们表明,从1947年开始(也许更早),为了追求相同的总体目标,图灵实际上提出了不只一个而是许多比较人类和机器的测试。这些测试涉及学习,思维和智力,可以应用于各种小和大的任务,包括简单的解决问题,国际象棋和围棋等游戏,以及一般对话。但他的主要目标从来都不是仅仅定义或操作这些东西。相反,它总是在本质上更加基本和进步:也就是说,以他当时的数学哲学家的方式仔细和严格地准备概念基础,在这个基础上,未来的计算技术可以成功地构思出来,首先由科学家和工程师,然后由决策者和整个社会。
人们普遍忽视的是,也许模仿游戏最重要的先驱可以在图灵1948年长期未发表的人工智能研究论文的最后一部分中找到,标题为“智力作为情感概念(Intelligence as an Emotional Concept)”。本节非常清楚地表明,引入诸如模仿游戏之类的测试的中心目的是消除我们的普通概念以及我们对它们的普通使用可能产生的误解。正如图灵所解释的那样:
我们认为某物以智能方式表现的程度取决于我们自己的心理状态和训练,也取决于所考虑对象的属性。如果我们能够解释和预测它的行为,或者如果似乎没有什么潜在的计划,我们几乎没有模仿智能的诱惑。
我们希望我们对某物是否智能的科学判断是客观的,至少在某种程度上,我们的判断不会取决于我们自己的心理状态;例如,关于我们是否能够解释相关行为,或者我们是否可能害怕在特定情况下出现智能的可能性。出于这个原因——正如他在三次广播和他1950年的论文中所解释的那样——图灵提出了消除我们普通概念中情感成分的方法。在1948年的论文中,他写道:
即使在目前的知识阶段,也可以在这些方面做一些实验。设计一台纸机[即写在纸上的程序]并不难,它将玩一个不是很糟糕的国际象棋游戏。现在让三个男人作为实验A,B,C的受试者。A和C是相当差的棋手,B是操作造纸机的操作员。(为了使他能够相当快地工作,建议他既是数学家又是国际象棋选手。两个房间用于一些用于交流动作的安排,并在C和A或纸机之间进行游戏。C可能会发现很难分辨出他在与哪个玩。
的确,除了他的概念工作之外,图灵还提出了许多哲学论据来捍卫机器智能的可能性,预测——而且可以说是驳斥——所有最有影响力的反对意见(从卢卡斯-彭罗斯的论点到休伯特·德雷福斯,再到意识)。但这与提供支持机器智能存在的形而上学论据明显不同,图灵坚决拒绝这样做。
“如果一台机器能思考,它可能会比我们更聪明地思考”
没有理由相信图灵不认真,在他1950年的论文中,他说:
读者会预料到,我没有非常令人信服的积极论据来支持我的观点。如果我有的话,我就不应该如此费尽心思地指出相反观点中的谬误。
但他总是足够谨慎地表达自己的观点,不是根据我们的普通概念——例如,机器是否可以“思考”——而是严格地根据推测,即机器何时可以在人类层面上执行(或多或少)客观可衡量的任务(如模仿游戏)。与此同时,他肯定不同意计算机科学家Edsger Dijkstra在1984年表达的观点,该观点在今天的人工智能研究人员中仍然很受欢迎,即“机器是否可以思考的问题......这与潜艇是否会游泳的问题一样重要”。相反,图灵充分意识到这类问题在文化、政治和科学上的重要性。例如,在一次广播中,“数字计算机能思考吗?(Can Digital Computers Think?)”,他最后问道:
如果一台机器可以思考,它可能会比我们更聪明地思考,那么我们应该在哪里呢?即使我们可以让机器处于从属地位,例如在战略时刻关闭电源,作为一个物种,我们也应该感到非常谦卑。...这个新的危险...如果它真的来了...虽然很遥远,但不是天文数字上的遥远,当然可以给我们带来焦虑。在关于这个主题的谈话或文章中,习惯上以声明的形式提供一丝安慰,即某些特别人类的特征永远不会被机器模仿。例如,可以说没有机器能写出好的英语,或者它不能受到性吸引力的影响或抽烟斗。我不能提供任何这样的安慰,因为我相信,没有这种界限是可以设定的。
最后,他指出了这个问题对人类认知研究的重要性:
整个思维过程对我们来说仍然相当神秘,但我相信,尝试制造一台思考机器将极大地帮助我们找出自己是如何思考的。
今天,我们可以自信地说,他是对的;他是对的。制造一台思考机器的尝试无疑以这种方式帮助我们。此外,他还在1950年的论文中正确地预测,“在本世纪末,单词的使用和一般的受过教育的观点将发生如此大的变化,以至于人们将能够谈论机器思维而不会被期望相矛盾”。当然,他并不是说心灵和机器的问题会得到解决。事实上,问题只是变得更加紧迫。情感计算和生物工程的持续进步将促使越来越多的人相信,机器不仅可以思考,还可以感觉到,也许应该得到某些合法权利,等等。还有一些人(如罗杰·彭罗斯)可能仍然合理地否认计算机甚至可以计算。
图灵的基本概念工作与他的实践实验方法相结合,使他不仅在1935-36年构思了现代计算的基本原理,而且在1947-48年,他预测了70多年后人工智能和机器学习领域一些最成功的理论方法。可以说,正是这种组合使他从一个数学工作被认为有前途但不整洁的小学生,他的想法被他的老师认为“模糊”和“浮夸”,到成为20世纪最具创新性的头脑之一。
评论留言