第1章 绪论

人工智能(Artificial Intelligence)主要研究用人工的方法和技术,模仿、延伸和扩展人的智能,实现机器智能。人工智能的长期目标是实现达到人类智力水平的人工智能。自1956年人工智能诞生以来,取得了许多令人兴奋的成果,在很多领域得到了广泛的应用。本章将对人工智能学科作一简要的介绍,包括发展历史、研究内容、研究方法以及主要的应用领域。

1.1 什么是人工智能

人工智能是极具挑战性的领域。伴随着大数据、类脑计算和深度学习等技术的发展,人工智能的浪潮又一次掀起。目前信息技术、互联网等领域几乎所有主题和热点,如搜索引擎、智能硬件、机器人、无人机和工业4.0,其发展突破的关键环节都与人工智能有关。

1956年四位年轻学者:麦卡锡(McCarthy J)、明斯基(Minsky M)、罗彻斯特(Roch-ester N)和香农(Shannon C)共同发起和组织召开了用机器模拟人类智能的夏季专题讨论会。会议邀请了包括数学、神经生理学、精神病学、心理学、信息论和计算机科学领域的10名学者参加,为期两个月。此次会议是在美国的新罕布什尔州的达特茅斯(Dartmouth)召开,也称为达特茅斯夏季讨论会。

会议上,科学家运用数理逻辑和计算机的成果,提供关于形式化计算和处理的理论,模拟人类某些智能行为的基本方法和技术,构造具有一定智能的人工系统,让计算机去完成需要人的智力才能胜任的工作。其中明斯基的神经网络模拟器、麦卡锡的搜索法、西蒙(Si-mon H)和纽厄尔(Newell A)的“逻辑理论家”成为讨论会的三个亮点。

在达特茅斯夏季讨论会上,麦卡锡提议用人工智能(Artificial Intelligence)作为这一交叉学科的名称,定义为制造智能机器的科学与工程,标志着人工智能学科的诞生。半个多世纪来,人们从不同的角度、不同的层面给出对人工智能的定义。下面介绍四种对人工智能的定义。

978-7-111-52189-1-Chapter01-1.jpg

图1-1 图灵测试

1.类人行为方法

库兹韦勒(Kurzweil R)提出人工智能是一种创建机器的技艺,这种机器能够执行需要人的智能才能完成的功能[Kurzweil 1990]。这与图灵测试的观点很吻合,是一种类人行为定义的方法。1950年,图灵(Turing A)提出图灵测试,并将“计算”定义为:应用形式规则,对未加解释的符号进行操作[Turing 1950]。图1-1给出了图灵测试的示意图,将一个人与一台机器置于一间房间中,而与另外一个人分隔开来,并把后一个人称为询问者。询问者不能直接见到屋中任一方,也不能与他们说话,因此他不知道到底哪一个实体是机器,只可以通过一个类似终端的文本设备与他们联系。然后让询问者仅根据通过这个仪器提问收到的答案辨别出哪个是计算机,哪个是人。如果询问者不能区别出机器和人,那么根据图灵的理论,就可以认为这个机器是智能的。

图灵测试具有直观上的吸引力,成为许多现代人工智能系统评价的基础。如果一个系统已经有可能在某个专业领域实现了智能,那么就可以通过把它对一系列给定问题的反应与人类专家的反应相比较来对其进行评估。

图灵测试也引发了很多争议,其中最著名的是塞尔(Searle J)的“中文屋论证”[Searle 1980]。塞尔设想自己被锁在一间屋子里,给了他大批的中文文本,塞尔本人对中文一窍不通,既不会写也不会说,甚至也不能将中文文本与日文中的汉字和平假名/片假名一样的图形相区别。这时他又得到了与这个中文文本相联系的英文规则书,由于塞尔的母语是英文,所以他认为自己可以轻易地理解并把握这本规则书。接下来塞尔将接收到屋外传来的英文指令和中文问题,指令教他怎样将规则书与中文文本联系起来,得到答案。当塞尔对规则书和脚本足够熟悉的时候,就可以熟练地输出处理编写后的中文答案。一般人也难以区分塞尔与母语讲中文的人,但是事实上,塞尔认为整个过程中他根本不懂、不理解中文,只是执行规则书上的“程序”。这种行为在中国人看来是与计算机用中文作答没有什么区别的,但却成功地通过了图灵测试,并不具有理解中文的智能。基于这一点,塞尔认为即使机器通过了图灵测试,也不一定说明机器就真的像人一样有思维和意识。

2.类人思维方法

1978年,贝尔曼(Bellman R E)提出人工智能是那些与人的思维、决策、问题求解和学习等有关活动的自动化[Bellman 1978]。主要采用的是认知模型的方法——关于人类思维工作原理的可检测的理论。为确定人类思维的内部是怎样工作的,可以有两种方法:通过内省或者通过心理学实验。一旦有了关于人类思维足够精确的理论,就可能把这种理论用计算机程序实现。如果该程序的输入/输出和实时行为与人的行为相一致,这就证明该程序可能按照人类模式运行的。例如,纽厄尔和西蒙开发了“通用问题求解器”GPS[Newell et al.1961]。他们并不满足于仅让程序能够正确地求解问题,而是更关心对程序的推理步骤轨迹与人对同一个问题的求解步骤的比较。作为交叉学科的认知科学,把来自人工智能的计算机模型与来自心理学的实验技术相结合,试图创立一种精确而且可检验的人类思维工作方式理论。

20世纪50年代末,在对神经元的模拟中提出了用一种符号来标记另一些符号的存储结构模型,这是早期的记忆块(Chunks)概念。80年代初,纽厄尔(Newell A)认为,通过获取任务环境中关于模型问题的知识,可以改进系统的性能,记忆块可以作为对人类行为进行模拟的模型基础。通过观察问题求解过程,获取经验记忆块,用其代替各个子目标中的复杂过程,可以明显提高系统求解的速度。由此奠定了经验学习的基础。1987年,纽厄尔、莱尔德(Laird J)和罗森布鲁姆(Rosenbloom P S)提出了一个通用解题结构SOAR[New-ell et al.1987],并希望该解题结构能实现各种弱方法。SOAR是State,Operator and Result的缩写,即状态、算子和结果之意,意味着实现弱方法的基本原理是不断地用算子作用于状态,以得到新的结果。SOAR是一种理论认知模型,它既从心理学角度,对人类认知建模,又从知识工程角度,提出一个通用解题结构。SOAR的学习机制是由外部专家的指导来学习一般的搜索控制知识。外部指导可以是直接劝告,也可以是给出一个直观的简单问题。系统把外部指导给定的高水平信息转化为内部表示,并学习搜索记忆块。

3.理性思维方法

1985年,查尼艾克(Charniak E)和麦克德莫特(McDermott D)提出人工智能是用计算模型研究智力能力[Charniak et al.1985]。这是一种理性思维方法。一个系统如果能够在它所知范围内正确行事,它就是理性的。古希腊哲学家亚里士多德(Aristotle)是首先试图严格定义“正确思维”的人之一,他将其定义为不能辩驳的推理过程。他的三段论方法给出了一种推理模式,当已知前提正确时总能产生正确的结论。例如,专家系统是推理系统,所有的推理系统都是智能系统,所以专家系统是智能系统。这些思维法则被认为支配着心智活动,对它们的研究创立了“逻辑学”研究领域。

19世纪后期至20世纪早期发展起来的形式逻辑给出了描述事物的语句以及事物之间关系的精确的符号。到了1965年,原则上已经有程序可以求解任何用逻辑符号描述的可解问题。在人工智能领域中传统上所谓的逻辑主义希望通过编制逻辑程序来创建智能系统。

这种逻辑方法有两个主要问题。首先,把非形式的知识用形式的逻辑符号表示是不容易做到的,特别是当这些知识不是100%确定的时候。其次,“原则上”可以解决一个问题与实际解决问题之间有很大的不同。甚至对于仅有几十条事实的问题进行求解,如果没有一定的指导来选择合适的推理步骤,都可能耗尽任何计算机的资源。

4.理性行为方法

尼尔森(Nilsson N J)认为人工智能关心的是人工制品中的智能行为[Nilsson 1998]。这种人工制品主要指能够动作的智能体(Agent)。行为上的理性指的是已知某些信念,执行某些动作以达到某个目标。智能体可以看作是可以进行感知和执行动作的某个系统。在这种方法中,人工智能可以认为就是研究和建造理性智能体。

在“理性思维”方法中,它所强调的是正确的推理。作出正确的推理有时被作为理性智能体的一部分,因为理性行动的一种方法是逻辑地推出结论。另外,正确的推理并不是理性的全部,因为在有些情景下,往往没有某个行为一定是正确的,而其他的是错误的,也就是说没有可以证明是正确的应该做的事情,但是还必须要做某件事情。

当知识是完全的,并且资源是无限的时候,就是所谓的逻辑推理。当知识是不完全的,或者资源有限时,就是理性的行为。理性思维和行为常常能够根据已知的信息(知识、时间和资源等)作出最合适的决策。

简言之,人工智能主要研究用人工的方法和技术,模仿、延伸和扩展人的智能,实现机器智能。人工智能的长期目标是实现达到人类智力水平的人工智能。

1.2 人工智能的起源与发展历史

人类对智能机器的梦想和追求可以追溯到三千多年前。早在我国西周时代(公元前1066~公元前771年),就流传有关巧匠偃师献给周穆王艺伎的故事。东汉(公元25~公元220年)张衡发明的指南车是世界上最早的机器人雏形。

古希腊斯吉塔拉人亚里士多德(公元前384年~公元前322年)的《工具论》,为形式逻辑奠定了基础。布尔(Boole)创立的逻辑代数系统,用符号语言描述了思维活动中推理的基本法则,被后世称为“布尔代数”。这些理论基础对人工智能的创立发挥了重要作用。

人工智能的发展历史,可大致分为孕育期、形成期、基于知识的系统、神经网络的复兴和智能体的兴起。

1.人工智能的孕育期(1956年以前)

人工智能的孕育期大致可以认为是在1956年以前的时期。这一时期的主要成就是数理逻辑、自动机理论、控制论、信息论、神经计算和电子计算机等学科的建立和发展,为人工智能的诞生,准备了理论和物质的基础。这一时期的主要贡献包括:

1)1936年,图灵创立了理想计算机模型的自动机理论,提出了以离散量的递归函数作为智能描述的数学基础,给出了基于行为主义的测试机器是否具有智能的标准,即图灵测试。

2)1943年,心理学家麦克洛奇(McCulloch W S)和数理逻辑学家皮兹(Pitts W)在《数学生物物理公报(Bulletin of Mathematical Biophysics)》上发表了关于神经网络的数学模型[McCulloch et al.1943]。这个模型,现在一般称为M-P神经网络模型。他们总结了神经元的一些基本生理特性,提出神经元形式化的数学描述和网络的结构方法,从此开创了神经计算的时代。

3)1945年,冯·诺依曼(von Neumann J)提出的存储程序概念,1946年研制成功的第一台电子计算机ENIAC,为人工智能的诞生奠定了物质基础。

4)1948年,香农发表了《通讯的数学理论》[Shannon 1948],这标志着一门新学科——信息论的诞生。他认为人的心理活动可以用信息的形式来进行研究,并提出了描述心理活动的数学模型。

5)1948年,维纳(Wiener N)创立了控制论[Wiener 1948]。它是一门研究和模拟自动控制的生物和人工系统的学科,标志着人们根据动物心理和行为科学进行计算机模拟研究和分析的基础已经形成。

2.人工智能的形成期(1956~1969年)

人工智能的形成期大约从1956年开始到1969年。这一时期的主要成就包括1956年在美国的达特茅斯(Dartmouth)大学召开的为期两个月的学术研讨会,提出了“人工智能”这一术语,标志着这门学科的正式诞生;还有包括在定理机器证明、问题求解、LISP语言、模式识别等关键领域的重大突破。这一时期的主要贡献包括:

1)1956年纽厄尔和西蒙的“逻辑理论家”程序,该程序模拟了人们用数理逻辑证明定理时的思维规律。该程序证明了怀特海德(Whitehead)和卢素(Russell)的《数学原理》一书中第二章中的38条定理,后来经过改进,又于1963年证明了该章中的全部52条定理。这一工作受到了人们高度的评价,被认为是计算机模拟人的高级思维活动的一个重大成果,是人工智能的真正开端。

2)1956年塞缪尔(Samuel)研制了跳棋程序,该程序具有学习功能,能够从棋谱中学习,也能在实践中总结经验,提高棋艺。它在1959年打败了塞缪尔本人,又在1962年打败了美国一个州的跳棋冠军。这是模拟人类学习过程的一次卓有成效的探索,是人工智能的一个重大突破。

3)1958年麦卡锡提出表处理语言LISP,它不仅可以处理数据,而且可以方便地处理符号,成为人工智能程序设计语言的重要里程碑。目前LISP语言仍然是人工智能系统重要的程序设计语言和开发工具。

4)1960年,纽厄尔、肖(Shaw)和西蒙等研制了通用问题求解程序GPS,它是对人们求解问题时的思维活动的总结。他们发现人们求解问题时的思维活动包括三个步骤:①制订出大致的计划;②根据记忆中的公理、定理和解题计划,按计划实施解题过程;③在实施解题过程中,不断进行方法和目的的分析,修正计划。其中他们首次提出了启发式搜索的概念。

5)1965年,鲁宾逊(Robinson J A)提出归结法,被认为是一个重大的突破,也为定理证明的研究带来了又一次高潮。

6)1968年,斯坦福大学费根鲍姆(Feigenbaum E A)等成功研制了化学分析专家系统DENDRAL,被认为是专家系统的萌芽,是人工智能研究从一般思维探讨到专门知识应用的一次成功尝试。

7)知识表示采用了奎廉(Quillian J R)提出的特殊的结构:语义网络。明斯基在1968年从信息处理的角度对语义网络的使用作出了很大的贡献。

此外还有很多其他的成就,如1956年乔姆斯基(Chomsky N)提出的文法体系等。正是这些成就,使得人们对这一领域寄予了过高的希望。1958年,卡耐梅隆大学(CMU)的西蒙预言,不出10年计算机将会成为国际象棋的世界冠军,但是一直到了1998年这一预言才成为现实。20世纪60年代,麻省理工学院(MIT)一位教授提到:“在今年夏天,我们将开发出电子眼。”然而,直到今天,仍然没有通用的计算机视觉系统可以很好理解动态变化的场景。70年代,很多人相信大量的机器人很快就会从工厂进入家庭。直到今天,服务机器人才开始进入家庭。

3.低潮时期(1966~1973年)

人工智能快速发展了一段时期后,遇到了很多的困难,遭受了很多的挫折。如鲁宾逊的归结法的归结能力是有限的,证明两个连续函数之和还是连续函数时,推了十万步还没有推出来。

人们曾以为只要用一部字典和某些语法知识即可很快地解决自然语言之间的互译问题,结果发现并不那么简单,甚至闹出笑话。如英语句子:The spirit is willing but the flesh is weak(心有余而力不足),译成俄语再译成英语竟成了:The wine is good but the meat is spoiled(酒是好的,肉变质了)。这里遇到的问题是单词的多义性问题。那么人类翻译家为什么可以翻译好这些句子呢,而机器为什么不能呢?他们的差别在哪里呢?主要原因在于翻译家在翻译之前首先要理解这个句子,但机器不能,它只是靠快速检索、排列词序等一套办法进行翻译,并不能“理解”这个句子,所以错误在所难免。1966年,美国国家研究委员会一份顾问委员会的报告指出“还不存在通用的科学文本机器翻译,也没有很近的实现前景”。所有美国政府资助的学术性翻译项目都被取消了。

罗森布拉特(Rosenblatt F)于1957年提出了感知器[Rosenblatt 1958],它是一个具有一层神经元、采用阈值激活函数的前向网络。通过对网络权值的训练,可以实现对输入矢量的分类。感知器收敛定理使罗森勃拉特的工作取得圆满的成功。20世纪60年代,感知器神经网络好像可以做任何事。1969年,明斯基和佩珀特(Papert S)合写的《感知器》书中利用数学理论证明了单层感知器的局限性[Minsky et al.1969],引起全世界范围削减神经网络和人工智能的研究经费,使得人工智能走向低谷。

4.基于知识的系统(1969~1988年)

1965年,斯坦福大学的费根鲍姆和化学家勒德贝格(Lederberg J)合作研制出DEN-DRAL系统。1972~1976年,费根鲍姆又成功开发出医疗专家系统MYCIN。此后,许多著名的专家系统相继研发成功,其中较具代表性的有探矿专家系统PROSPECTOR、青光眼诊断治疗专家系统CASNET、钻井数据分析专家系统ELAS等。20世纪80年代,专家系统的开发趋于商品化,创造了巨大的经济效益。

1977年,美国斯坦福大学计算机科学家费根鲍姆在第五届国际人工智能联合会议上提出知识工程的新概念。他认为,“知识工程是人工智能的原理和方法,对那些需要专家知识才能解决的应用难题提供求解的手段。恰当运用专家知识的获取、表达和推理过程的构成与解释,是设计基于知识的系统的重要技术问题。”知识工程是一门以知识为研究对象的学科,它将具体智能系统研究中那些共同的基本问题抽取出来,作为知识工程的核心内容,使之成为指导具体研制各类智能系统的一般方法和基本工具。

知识工程的兴起,确立了知识处理在人工智能学科中的核心地位,使人工智能摆脱了纯学术研究的困境,使人工智能的研究从理论转向应用,从基于推理的模型转向知识的模型,使人工智能的研究走向了实用。

为了适应人工智能和知识工程发展的需要,日本在1981年宣布了第五代电子计算机的研制计划。其研制的计算机的主要特征是具有智能接口、知识库管理和自动解决问题的能力,并在其他方面具有人的智能行为。由于这一计划的提出,形成了一股热潮,促使世界上重要的国家都开始制订对新一代智能计算机的开发和研制计划,使人工智能进入了一个基于知识的兴旺时期[史忠植1988]。

5.神经网路的复兴(1986年至今)

1982年,美国加州工学院物理学家霍普菲尔德(Hopfield J J)使用统计力学的方法来分析网路的存储和优化特性,提出了离散的神经网络模型[Hopfield 1982],从而有力地推动了神经网络的研究。1984年霍普菲尔德又提出了连续神经网络模型[Hopfield et al. 1985]。

20世纪80年代神经网路复兴的真正推动力是反向传播算法的重新研究。该算法最早由Bryson和Ho于1969年提出。1986年,鲁梅尔哈特(Rumelhart D E)和麦克莱伦德(Mc-Clelland J L)等提出并行分布处理(Parallel Distributed Processing,PDP)的理论[Rumel-hart et al.1986],致力于认知的微观结构的探索,其中多层网络的误差传播学习法,即反向传播算法广为流传,引起人们极大的兴趣。世界上许多国家掀起了神经网络研究的热潮。从1985年开始,专门讨论神经网络的学术会议规模逐步扩大。1987年在美国召开了第一届神经网络国际会议,并发起成立国际神经网络学会(INNS)。

6.智能体的兴起(1993年至今)

20世纪90年代,随着计算机网络、计算机通信等技术的发展,关于智能体(Agent)的研究成为人工智能的热点。1993年,肖哈姆(Shoham Y)提出面向智能体的程序设计[Shoham 1993]。1995年,罗素(Russell S)和诺维格(Norvig P)出版了《人工智能》一书,提出“将人工智能定义为对从环境中接收感知信息并执行行动的智能体的研究”[Rus-sell et al.1995]。所以,智能体应该是人工智能的核心问题。斯坦福大学计算机科学系的海斯-罗斯(Hayes-Roth B)在IJCAI′95的特约报告中谈到:“智能体既是人工智能最初的目标,也是人工智能最终的目标”[Hayes-Roth 1995]。

在人工智能研究中,智能体概念的回归并不仅仅是因为人们认识到了应该把人工智能各个领域的研究成果集成为一个具有智能行为概念的“人”,更重要的原因是人们认识到了人类智能的本质是一种社会性的智能。要对社会性的智能进行研究,构成社会的基本构件“人”的对应物“智能体”理所当然地成为人工智能研究的基本对象,而社会的对应物“多智能体系统”也成为人工智能研究的基本对象。

我国的人工智能研究起步较晚。智能模拟纳入国家计划的研究始于1978年。1984年召开了智能计算机及其系统的全国学术讨论会。1986年起把智能计算机系统、智能机器人和智能信息处理(含模式识别)等重大项目列入国家高技术研究863计划。1997年起,又把智能信息处理、智能控制等项目列入国家重大基础研究973计划。进入21世纪后,在最新制订的《国家中长期科学和技术发展规划纲要(2006-2020年)》中,“脑科学与认知科学”已列入八大前沿科学问题之一。信息技术将继续向高性能、低成本、普适计算和智能化等主要方向发展,寻求新的计算与处理方式和物理实现是未来信息技术领域面临的重大挑战。

1981年起,我国相继成立了中国人工智能学会(CAAI)、全国高校人工智能研究会、中国计算机学会人工智能与模式识别专业委员会、中国自动化学会模式识别与机器智能专业委员会、中国软件行业协会人工智能协会、中国智能机器人专业委员会、中国计算机视觉与智能控制专业委员会以及中国智能自动化专业委员会等学术团体。1989年首次召开了中国人工智能联合会议(CJCAI)。1987年创刊了《模式识别与人工智能》杂志。2006年创刊了《智能系统学报》和《智能技术》杂志。2011年创刊了《International Journal of Intelligence Science》国际刊物。

中国的科技工作者已在人工智能领域取得了具有国际领先水平的创造性成果。其中,尤以吴文俊院士关于几何定理证明的“吴氏方法”最为突出,已在国际上产生重大影响,并荣获2001年国家科学技术最高奖励。现在,我国已有数以万计的科技人员和大学师生从事不同层次的人工智能研究与学习。人工智能研究已在我国深入开展,它必将为促进其他学科的发展和我国的现代化建设作出新的重大贡献。

1.3 人工智能研究的基本内容

人工智能是一门新兴的边缘学科,是自然科学和社会科学的交叉学科,它吸取了自然科学和社会科学的最新成果,以智能为核心,形成了具有自身研究特点的新的体系。人工智能的研究涉及广泛的领域,包括知识表示、搜索技术、机器学习、求解数据和知识不确定问题的各种方法等。人工智能的应用领域包括专家系统、博弈、定理证明、自然语言理解、图像理解和机器人等。人工智能也是一门综合性的学科,它是在控制论、信息论和系统论的基础上诞生的,涉及哲学、心理学、认知科学、计算机科学、数学以及各种工程学方法,这些学科为人工智能的研究提供了丰富的知识和研究方法。图1-2给出了和人工智能有关的学科以及人工智能的研究和应用领域的简单图示。

978-7-111-52189-1-Chapter01-2.jpg

图1-2 人工智能的研究和应用

1.3.1 认知建模

美国心理学家休斯敦(Houston P T)等把认知归纳为如下5种类型:

1)认知是信息的处理过程。

2)认知是心理上的符号运算。

3)认知是问题求解。

4)认知是思维。

5)认知是一组相关的活动,如知觉、记忆、思维、判断、推理、问题求解、学习、想象、概念形成和语言使用等。

人类的认知过程是非常复杂的,建立认知模型的技术常称为认知建模,目的是为了从某些方面探索和研究人的思维机制,特别是人的信息处理机制,同时也为设计相应的人工智能系统提供新的体系结构和技术方法。认知科学用计算机研究人的信息处理机制时表明,在计算机的输入和输出之间存在着由输入分类、符号运算、内容存储与检索、模式识别等方面组成的实在的信息处理过程。尽管计算机的信息处理过程和人的信息处理过程有实质性差异但可以由此得到启发,认识到人在刺激和反应之间也必然有一个对应的信息处理过程,这个实在的过程只能归结为意识过程。计算机的信息处理和人的信息处理在符号处理这一点的相似性是人工智能名称由来和它赖以实现和发展的基点。信息处理也是认知科学与人工智能的联系纽带。

1.3.2 知识表示

人类的智能活动过程主要是一个获得并运用知识的过程,知识是智能的基础。人们通过实践,认识到客观世界的规律性,经过加工整理、解释、挑选和改造而形成知识。为了使计算机具有智能,使它能模拟人类的智能行为,就必须使它具有适当形式表示的知识。知识表示是人工智能中一个十分重要的研究领域。

所谓知识表示实际上是对知识的一种描述,或者是一组约定,一种计算机可以接受的用于描述知识的数据结构。知识表示是研究机器表示知识的可行的、有效的、通用的原则和方法。知识表示问题一直是人工智能研究中最活跃的部分之一。目前,常用的知识表示方法有逻辑模式、产生式系统、框架、语义网络、状态空间、面向对象和连接主义等。

1.3.3 自动推理

从一个或几个已知的判断(前提)逻辑地推论出一个新的判断(结论)的思维形式称为推理,这是事物的客观联系在意识中的反映。自动推理是知识的使用过程,人解决问题就是利用以往的知识,通过推理得出结论。自动推理是人工智能研究的核心问题之一。

按照新的判断推出的途径来划分,自动推理可分为演绎推理、归纳推理和反绎推理。演绎推理是一种从一般到个别的推理过程。演绎推理是人工智能中的一种重要的推理方式,目前研制成功的智能系统中,大多是用演绎推理实现的。

与演绎推理相反,归纳推理是一种从个别到一般的推理过程。归纳推理是机器学习和知识发现的重要基础,是人类思维活动中最基本、最常用的一种推理形式。

顾名思义,反绎推理是由结论倒推原因。在反绎推理中,我们给定规则pqq的合理信念。然后希望在某种解释下得到谓词p为真。反绎推理是不可靠的,但由于q的存在,它又被称为最佳解释推理。

按推理过程中推出的结论是否单调地增加,推理又分为单调推理和非单调推理。其单调含义是指已知为真的命题数目随着推理的进行而严格地增加。在单调逻辑中,新的命题可以加入系统,新的定义可以被证明,并且这种加入和证明决不会导致前面已知的命题或已证的命题变成无效。在本质上人类的思维及推理活动并不是单调的。人们对周围世界中的事物的认识、信念和观点,总是处于不断的调整之中。比如,根据某些前提推出某一结论,但当人们又获得另外一些事实后,却又取消这一结论。在这种情况下,结论并不随着条件的增加而增加,这种推理过程就是非单调推理。非单调推理是人工智能自动推理研究的成果之一,1978年赖特(Reiter R)首先提出了非单调推理方法封闭世界假设(CWA)[Reiter 1978],并提出了默认推理[Reiter 1980]。1979年杜伊尔(Doyle)建立了真值维护系统TMS[Doyle 1979]。1980年麦卡锡提出了限定逻辑[McCarthy 1980]。

在现实世界中存在大量不确定问题。不确定性来自于人类的主观认识与客观实际之间存在差异。事物发生的随机性,人类知识的不完全、不可靠、不精确和不一致,自然语言中存在的模糊性和歧义性都反映了这种差异,都会带来不确定性。针对不同的不确定性的起因,人们提出了不同的理论和推理方法。在人工智能中,有代表性的不确定性理论和推理方法有Bayes理论、Dempster-Shafer证据理论和Zadeh模糊集理论等。

搜索是人工智能的一种问题求解方法,搜索策略决定着问题求解的一个推理步骤中知识被使用的优先关系。可分为无信息导引的盲目搜索和利用经验知识导引的启发式搜索。启发式知识常由启发式函数来表示,启发式知识利用得越充分,求解问题的搜索空间就越小,解题效率越高。典型的启发式搜索方法有A* 、AO* 算法等。近几年搜索方法研究开始注意那些具有百万节点的超大规模的搜索问题。

1.3.4 机器学习

机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。只有让计算机系统具有类似人的学习能力,才有可能实现人类水平的人工智能。机器学习是人工智能研究的核心问题之一,是当前人工智能理论研究和实际应用非常活跃的研究领域。

常见的机器学习方法有归纳学习、类比学习、分析学习、强化学习、遗传算法和连接学习等。深度学习是机器学习研究中的一个新的领域,其概念由欣顿(Hinton G E)等于2006年提出[Hinton et al.2006],它模仿人脑神经网络进行分析学习的机制来解释图像、声音和文本的数据。2015年,百度利用超级计算机Minwa在测试ImageNet中取得了世界最好成绩,错误率仅为4.58%,刷新了图像识别的纪录。机器学习研究的任何进展,都将促进人工智能水平的提高。

1.4 人工智能研究的主要学派

在人工智能60多年的研究过程中,由于人们对智能本质的理解和认识不同,形成了人工智能研究的多种不同的途径。不同的研究途径具有不同的学术观点,采用不同的研究方法,形成了不同的研究学派。目前在人工智能界主要的研究学派有符号主义、连接主义和行为主义等学派。符号主义方法以物理符号系统假设和有限合理性原理为基础;连接主义方法是以人工神经网络模型为核心;行为主义方法侧重研究感知-行动的反应机制。

1.4.1 符号主义

符号主义学派,亦称为功能模拟学派。主要观点认为智能活动的基础是物理符号系统,思维过程是符号模式的处理过程。

纽厄尔和西蒙在1976年的美国计算机学会(ACM)图灵奖演说中,对物理符号系统假设进行了总结[Newell et al.1976],他们指出:展现一般智能行为的物理系统其充要条件是它是一个物理符号系统。充分性表明智能可以通过任意合理组织的物理符号系统来得到。必要性表明一个有一般智能的主体必须是一个物理符号系统的一个实例。物理符号系统假设的必要性要求一个智能体,不管它是人、外星人还是计算机,都必须通过在符号结构上操作的物理实现来获得智能。

一般智能行为表示人类活动中的相同的动作和行为。在物理极限内,系统将展示适合于其目的的行为,并适应于它所在环境的要求。

在后来的许多年中,人工智能和认知科学都在这个假设所描绘的领域中进行了大量的研究。物理符号系统假设导致了三个重要的方法论方面的保证:①符号的使用以及符号系统作为描述世界的中介;②搜索机制的设计,尤其是启发式搜索,用来探索这些符号系统能够支持的可能推理的空间;③认知体系结构的分离,这里的意思是假定一个合理设计的符号系统能够提供智能的完整的因果理由,不考虑其实现的方法。基于这样的观点,最后人工智能变成为经验式和构造式的学科,它试图通过建立智能的工作模型来理解智能。

以符号主义的观点看,知识表示是人工智能的核心,认知就是处理符号,推理就是采用启发式知识及启发式搜索对问题求解的过程,而推理过程又可以用某种形式化的语言来描述。符号主义主张用逻辑的方法来建立人工智能的统一理论体系,但是存在“常识”问题以及不确定性事物的表示和处理问题,因此,受到其他学派的批评。

通常被称为“经典的人工智能”是在符号主义观点指导下开展研究的。经典的人工智能研究中又可以分为认知学派和逻辑学派。认知学派以西蒙、明斯基和纽厄尔等为代表,从人的思维活动出发,利用计算机进行宏观功能模拟。逻辑学派以麦卡锡和尼尔森等为代表,主张用逻辑来研究人工智能,即用形式化的方法描述客观世界。

1.4.2 连接主义

基于神经元和神经网络的连接机制和学习算法的人工智能学派是连接主义(Connection-ism),亦称为结构模拟学派。这种方法研究能够进行非程序的、可适应环境变化的、类似人类大脑风格的信息处理方法的本质和能力。这种学派的主要观点认为,大脑是一切智能活动的基础,因而从大脑神经元及其连接机制出发进行研究,搞清楚大脑的结构以及它进行信息处理的过程和机理,可望揭示人类智能的奥秘,从而真正实现人类智能在机器上的模拟。

该方法的主要特征表现在:以分布式的方式存储信息,以并行方式处理信息,具有自组织、自学习能力,适合于模拟人的形象思维,可以比较快地得到一个近似解。正是这些特点,使得神经网络为人们在利用机器加工处理信息方面提供了一个全新的方法和途径。但是这种方法不适合于模拟人们的逻辑思维过程,并且人们发现,已有的模型和算法也存在一定的问题,理论上的研究也有一定的难点,因此单靠连接机制解决人工智能的全部问题也是不现实的。

连接主义的代表性成果是1943年麦克洛奇和皮兹提出的一种神经元的数学模型,即M-P模型,并由此组成一种前馈网络。可以说M-P是人工神经网络最初的模型,开创了神经计算的时代,为人工智能创造了一条用电子装置模拟人脑结构和功能的新的途径。从此之后,神经网络理论和技术研究的不断发展,并在图像处理、模式识别等领域的重要突破,为实现连接主义的智能模拟创造了条件。

1.4.3 行为主义

行为主义学派,亦称为行为模拟学派,认为智能行为的基础是“感知-行动”的反应机制。基于智能控制系统的理论、方法和技术,研究拟人的智能控制行为。

1991年,布鲁克斯(Brooks R A)提出了无须知识表示的智能和无须推理的智能[Brooks 1991],他认为智能只是在与环境交互作用中表现出来,不应采用集中式的模式,而是需要具有不同的行为模块与环境交互,以此来产生复杂的行为。他认为任何一种表达方式都不能完善地代表客观世界中的真实概念,因而用符号串表示智能过程是不妥当的。这在许多方面是行为心理学在人工智能中的反映。基于行为的基本观点可以概括为:

1)知识的形式化表达和模型化方法是人工智能的重要障碍之一。

2)智能取决于感知和行动,应直接利用机器对环境作用后,以环境对作用的响应为原型。

3)智能行为只能体现在世界中,通过与周围环境交互而表现出来。

4)人工智能可以像人类智能一样逐步进化,分阶段发展和增强。

布鲁克斯这种基于行为(进化)的观点开辟了人工智能研究的新途径。以这些观点为基础,布鲁克斯研制出了一种机器虫,用一些相对独立的功能单元,分别实现避让、前进和平衡等基本功能,组成分层异步分布式网络,取得了一定的成功,特别是为机器人的研究开创了一种新的方法。

行为主义思想提出后引起了人们广泛的关注,有人认为布鲁克斯的机器虫在行为上的成功并不能产生高级控制行为,指望让机器从昆虫的智能进化到人类的智能只是一种幻想。尽管如此,行为主义学派的兴起,表明了控制论和系统工程的思想将进一步影响人工智能的发展。

上述三种研究方法从不同的侧面研究了人的自然智能,与人脑的思维模型有着对应的关系。粗略地划分,可以认为符号主义研究抽象思维,连接主义研究形象思维,而行为主义研究感知思维[Shi 1992]。研究人工智能的三大学派、三条途径各有所长,要取长补短,综合集成。

1.5 人工智能的应用

当前,几乎所有的科学与技术的分支都在共享着人工智能领域所提供的理论和技术。这里列举一些人工智能经典的、有代表性和有重要影响的应用领域。

1.专家系统

专家系统(Expert System)是一类具有专门知识和经验的计算机智能程序系统,通过对人类专家的问题求解能力的建模,采用人工智能中的知识表示和知识推理技术来模拟通常由专家才能解决的复杂问题,达到具有与专家同等解决问题能力的水平。这种基于知识的系统设计方法是以知识库和推理机为中心而展开的,即

专家系统=知识库+推理机

它把知识从系统中与其他部分分离开来。专家系统强调的是知识而不是方法。很多问题没有基于算法的解决方案,或算法方案太复杂,采用专家系统可以利用人类专家拥有的丰富知识,因此专家系统也称为基于知识的系统(Knowledge-Based Systems)。一般来说,一个专家系统应该具备以下3个要素:

1)具备某个应用领域的专家级知识。

2)能模拟专家的思维。

3)能达到专家级的解题水平。

20世纪80年代以来,在知识工程的推动下,涌现出了不少专家系统开发工具,如EMYCIN、CLIPS(OPS5、OPS83)、G2、KEE、OKPS等。

2.数据挖掘

数据挖掘是人工智能领域中一个令人激动的成功应用,它能够满足人们从大量数据中挖掘出隐含的、未知的、有潜在价值的信息和知识的要求。对数据拥有者而言,在他的特定工作或生活环境里,自动发现隐藏在数据内部的、可被利用的信息和知识。要实现这些目标,需要有大量的原始数据、明确的挖掘目标、相应的领域知识、友善的人-机界面,以及寻找合适的开发方法。挖掘结果供数据拥有者决策使用,必须得到拥有者的支持、认可和参与。

目前,数据挖掘在市场营销、银行、制造业、保险业、计算机安全、医药、交通和电信等领域已经有许多成功案例。目前具有代表性的数据挖掘工具或平台有美国SAS公司的SAS Enterprise Miner、IBM公司的Intelligent Miner、Solution公司的Clementine、加拿大Cognos公司的Scenario、美国大数据公司Palantir、中国科学院计算技术研究所智能信息处理重点实验室开发的大数据挖掘云引擎CBDME等。

3.自然语言处理

自然语言处理研究计算机通过人类熟悉的自然语言与用户进行听、说、读、写等交流技术,是一门与语言学、计算机科学、数学、心理学和声学等学科相联系的交叉性学科。自然语言处理研究内容主要包括:语言计算(语音与音位、词法、句法、语义和语用等各个层面上的计算)、语言资源建设(计算词汇学、术语学、电子词典、语料库和知识本体等)、机器翻译或机器辅助翻译、汉语和少数民族语言文字输入输出及其智能处理、中文手写和印刷体识别、中文语音识别及文语转换、信息检索、信息抽取与过滤、文本分类、中文搜索引擎和以自然语言为枢纽的多媒体检索等。

中文信息处理(包括对汉语以及少数民族语言的信息处理)在我国信息领域科学技术进步与产业发展中占有特殊位置,推动着我国信息科技与产业的发展。如王选的汉字激光照排(两次获得国家科技进步一等奖)、联想汉卡(获国家科技进步一等奖)、刘迎建的汉王汉字输入系统(获国家科技进步一等奖)、陈肇雄的机器翻译系统(获国家科技进步一等奖)、丁晓青的清华文通汉字OCR系统(获国家科技进步二等奖)等。这些体现着鲜明的自主创新精神的成果,既是我国中文信息处理事业发展历程的见证,同时也将为该学科未来的继续蓬勃发展提供宝贵的精神财富。

我们已经进入以互联网为主要标志的海量信息时代。一个与此相关的严峻事实是,数字信息有效利用已成为制约信息技术发展的一个全局性瓶颈问题。自然语言处理无可避免地成为信息科学技术中长期发展的一个新的战略制高点。《国家中长期科学和技术发展规划纲要》指出,我国将促进“以图像和自然语言理解为基础的‘以人为中心’的信息技术发展,推动多领域的创新”。

4.智能机器人

智能机器人是一种自动化的机器,具有相当发达的“大脑”,具备一些与人或生物相似的智能能力,如感知能力、规划能力、动作能力和协同能力,是一种具有高度灵活性的自动化机器。随着人们对机器人技术智能化本质认识的加深,机器人技术开始向人类活动的各个领域渗透。结合这些领域的应用特点,人们发展了各式各样的具有感知、决策、行动和交互能力的特种机器人和各种智能机器,如移动机器人、微机器人、水下机器人、医疗机器人、军用机器人、空间机器人和娱乐机器人等。

智能机器人具有广阔的发展前景,尽管国内外对智能机器人的研究已经取得了很多成果,但是智能化水平还不是很高,因此必须加快智能机器人的发展。智能机器人的作业环境是相当复杂的,要想机器人有比较好的发展,则要解决现在面临的许多问题,那么我们人类应该多向自然界学习,通过对自然界生物的学习、模仿、复制和再造,从中发现相关的理论和技术方法,应用到机器人中,使得机器人在功能和技术水平上不断地有所突破,从而生产出更先进、更智能的机器人。

机器人世界杯足球赛(RoboCup)是当前引人注目的比赛,有利于推动机器人的研究和开发。有人预言由机器人组成的足球队将在2050年世界杯足球赛中能打败专业足球队。当然,目前研制的这些机器人,仍然只具有部分智能,它们与真正意义的生命智能还相距甚远,机器人视觉和自然语言交流是其中的两个主要难点。

5.模式识别

模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的信息进行处理和分析,以便对事物或现象进行描述、辨认、分类和解释的过程。模式是信息赖以存在和传递的形式,诸如波谱信号、图形、文字、物体的形状、行为的方式和过程的状态等都属于模式的范畴。人们通过模式感知外部世界的各种事物或现象,这是获取知识、形成概念和作出反应的基础。

早期的模式识别研究强调仿真人脑形成概念和识别模式的心理和生理过程。20世纪50年代,罗森布拉特(Roseblatt F)提出的感知器既是一个模式识别系统,也是把它作为人脑的数学模型来研究的。但随着实际应用的需要和计算技术的发展,模式识别研究多采用不同于生物控制论、生理学和心理学等方法的数学技术方法。1957年,周绍康首先提出用决策理论方法对模式进行识别。1962年,纳拉西曼(Narasimhan R)提出模式识别的句法方法,此后美籍华人学者傅京孙深入地开展了这方面的研究,并于1974年出版了第一本专著《句法模式识别及其应用》[Fu 1974]。现代发展的各种模式识别方法基本上都可以归纳为决策理论方法和结构方法两大类。

随着信息技术应用的普及,模式识别呈现多样性和多元化趋势,可以在不同的概念粒度上进行,其中生物特征识别成为模式识别研究活跃的领域,包括语音识别、文字识别、图像识别和人物景象识别等。生物特征的身份识别技术,如指纹(掌纹)身份识别、人脸身份识别、签名识别、虹膜识别和行为姿态身份识别也成为研究的热点,通过小波变换、模糊聚类、遗传算法、贝叶斯(Bayesian)理论、支持向量机等方法进行图像分割、特征提取、分类、聚类和模式匹配,使得身份识别成为确保经济安全、社会安全的重要工具。

6.分布式人工智能

分布式人工智能(Distributed Artificial Intelligence)研究一组分布的、松散耦合的智能体(Agent)如何运用它们的知识、技能和信息,为实现各自的或全局的目标协同工作。20世纪90年代以来,互联网的迅速发展为新的信息系统、决策系统和知识系统的发展提供了极好的条件,它们在规模、范围和复杂程度上增加极快,分布式人工智能技术的开发与应用越来越成为这些系统成功的关键。

分布式人工智能的研究可以追溯到20世纪70年代末期。早期分布式人工智能的研究主要是分布式问题求解,其目标是创建大粒度的协作群体,它们之间共同工作以对某一问题进行求解。1983年,休伊特(Hewitt C)和他的同事们研制了基于ACTOR模型的并发程序设计系统[Hewitt et al.1983]。ACTOR模型提供了分布式系统中并行计算理论和一组专家或ACTOR获得智能行为的能力。1991年,Hewitt提出开放信息系统语义[Hewitt 1991],指出竞争、承诺、协作和协商等性质应作为分布式人工智能的科学基础,试图为分布式人工智能的理论研究提供新的基础。1983年,麻萨诸塞大学的莱塞(Lesser V R)等研制了分布式车辆监控测试系统DVMT[Lesser et al.1983]。1987年,加瑟(Gasser L)等研制了MACE系统,这是一个实验型的分布式人工智能系统开发环境[Gasser et al.1988]。MACE中每一个计算单元都称作智能体,它们具有知识表示和推理能力,智能体之间通过消息传送进行通信。

20世纪90年代以来,智能体和多智能体系统成为分布式人工智能研究的主流。智能体可以看作是一个自动执行的实体,它通过传感器感知环境,通过效应器作用于环境。智能体的BDI模型,是基于智能体的思维属性建立的一种形式模型,其中B表示Belief(信念),D表示Desire(愿望),I表示Intention(意图)。多智能体系统即由多个智能体组成的系统,研究的核心是如何在一群自主的智能体之间进行行为的协调。多智能体系统可以构成一个智能体的社会,其形式包括群体、团队、组织和联盟等,具有更大的灵活性和适应性,更适合开放和动态的世界环境,成为当今人工智能研究的热点。

7.互联网智能

如果说计算机的出现为人工智能的实现提供了物质基础,那么互联网的产生和发展则为人工智能提供了更加广阔的空间,成为当今人类社会信息化的标志。互联网已经成为越来越多人的“数字图书馆”,人们普遍使用Google、百度等搜索引擎,为自己的日常工作和生活服务。

语义Web(Semantic Web)追求的目标是让Web上的信息能够被机器可理解,从而实现Web信息的自动处理,以适应Web信息资源的快速增长,更好地为人类服务[Berners-Lee et al.2001]。语义Web提供了一个通用的框架,允许跨越不同应用程序、企业和团体的边界共享和重用数据。语义Web是W3C领导下的协作项目,有大量研究人员和业界伙伴参与。语义Web以资源描述框架(RDF)为基础。RDF以XML作为语法、URI作为命名机制,将各种不同的应用集成在一起。

语义Web成功地将人工智能的研究成果应用到互联网,包括知识表示、推理机制等。人们期待未来的互联网是一本按需索取的百科全书,可以定制搜索结果,可以搜索隐藏的Web页面,可以考虑用户所在的位置,可以搜索多媒体信息,甚至可以为用户提供个性化服务。

8.博弈

博弈(Game Playing)是人类社会和自然界中普遍存在的一种现象,如下棋、打牌、战争等。博弈的双方可以是个人、群体,也可以是生物群或智能机器,各方都力图用自己的智慧获取成功或击败对方。博弈过程可能产生惊人庞大的搜索空间。要搜索这些庞大而且复杂的空间需要使用强大的技术来判断备择状态、探索问题空间,这些技术被称为启发式搜索。博弈为人工智能提供了一个很好的实验场所,可以对人工智能的技术进行检验,以促进这些技术的发展。

在人工智能发展史上,1956年塞缪尔研制了跳棋程序,打败了自己。1997年5月11日,IBM“深蓝”计算机战胜了国际象棋大师卡斯帕罗夫(Kasparov G)。2006年8月9日,在北京举办的首届中国象棋人机大赛中,计算机以3胜5平2负的微弱优势战胜人类象棋大师。

下棋是一个典型的智力问题,求解过程通常是一个启发式搜索过程。下棋博弈中,以棋盘的全部格局作为状态,以合法的走步为操作,以启发式知识作导航,在一个状态空间内寻找到达获胜的路径。博弈中的棋局易于在计算机中表示,根本不需要表征更复杂问题所必需的复杂格式。博弈的简单性使测试博弈程序没有任何经济和道德上的负担。状态空间搜索是大多数博弈研究的基础。

1.6 小结和展望

本章首先讨论了什么是人工智能的问题。人工智能是研究可以理性地进行思考和执行动作的计算模型的学科,它是人类智能在计算机上的模拟。人工智能作为一门学科,经历了孕育、形成和发展等几个阶段,并且还在不断地发展。尽管人工智能也创造出了一些实用系统,但我们不得不承认这些系统远未达到人类的智能水平。

知识表示、推理、学习、智能搜索和数据与知识的不确定性处理是人工智能的基本研究领域,人工智能的典型应用领域包括专家系统、数据挖掘、自然语言处理、智能机器人、模式识别、分布式人工智能、互联网智能和博弈等。

人工智能的研究途径主要有以符号处理为核心的方法、以网络连接为主的连接机制方法,以及以感知和动作为主的行为主义方法等,这些方法的集成和综合已经成为当今人工智能研究的一个趋势。

进入21世纪,互联网的普及和大数据的兴起又一次将人工智能推向新的高峰。基于大数据、信息空间(Cyberspace)的知识自动化将开拓人类向人工世界进军,深度开发大数据和智力资源,深化农业和工业的智能革命。脑科学、认知科学和人工智能等学科交叉研究的智能科学将指引类脑计算的发展,实现人类水平的人工智能[Shi 2012]。

习题

1.什么是人工智能?它的研究目标是什么?

2.什么是图灵测试?讨论图灵关于计算机软件“智能”标准的不足。

3.描述一下你自己的计算机软件“智能”标准。

4.人工智能程序和传统的计算机程序之间有什么不同?

5.人工智能研究有哪些主要的学派?各有什么特点?

6.人工智能学科已创建50多年,列举你所知道的成功应用,以及失败的教训。

7.未来人工智能的可能突破有哪些方面?

8.人工智能的长期目标是人类水平的人工智能,我们应该如何努力实现这个目标?