第1章人工智能概述

1.1 什么是人工智能

人工智能是指由机器或软件所展现的智能。在学术研究领域，人工智能是指研究如何创建计算机和计算机软件具有的智能行为。在1956年的达沃斯会议，“人工智能”这个名词首次被正式使用。也正因如此，1956年被称为人工智能元年。

提到人工智能就不得不介绍艾伦·图灵（简称图灵）。图灵是英国数学家、计算机科学家和密码学家，他还被称为人工智能之父。2015年7月在中国上映的电影《模仿游戏》就改编自《艾伦·图灵传》。该影片聚焦于图灵的传奇人生，讲述了图灵运用优秀的数学天赋帮助盟军破译德国密码系统，从而扭转二战战局的故事。

1950年，图灵发表了一篇名为《计算机器与智能》（Computing Machinery and Intelligence）的论文，提出了著名的图灵测试。图灵测试介绍了一种关于可操作智能的定义。

图灵测试设计了如下一个场景：“一个人类的提问者，同时测试一个人和一台机器。提问者与被测试的人和被测试的机器是相互隔离的，提问者同时向被测试人和机器提问，经过一系列的问答测试之后，提问者不能分辨出谁是机器谁是人，那么就认为这台机器是具有智能的。”

除图灵测试外，还有视觉图灵测试。视觉图灵测试是由唐纳德·吉曼（Donald Geman）等人于2014年提出的。图灵测试针对文字语言，视觉图灵测试则针对图像，即根据一张给定的图像，提问者针对该图像随机提出问题，系统只需要回答Yes或No。如果系统回答完毕后，提问者无法识别回答者是人工智能系统还是人，则该系统被认定为通过了视觉图灵测试。目前，计算机视觉系统主要用于任务精度的测试，任务包括对象检测（object detection）、图像分割（segmentation）、定位（localization），如图1-1所示。

图1-1

视觉图灵测试可对计算机视觉的认知能力进行评估，视觉图灵测试不仅可以测试人工智能能否识别出图像中的某个物体，还可以测试人工智能对图像中物体之间关联关系的理解。但是目前，人工智能对图像中物体之间关联关系的理解能力还相对初级，而人类本身就具有对图像中物体之间关联关系的理解能力，所以人工智能的视觉图灵测试的结果与人类预期的结果有一定的差距。

图1-2所示为一张北京街景图，提问者可针对图像中指定的区域提出一系列问题，计算机视觉系统通过Yes或No来回答。图像中有一些内容被方框标注，方框中的内容是视觉图灵测试区域，提问者根据每个方框提出不同的问题，计算机对这些问题进行回答，如果回答正确则认为其拥有智能。

图1-2

对于人工智能是否拥有真正的智能，一些专家认为即使其通过了图灵测试，也不一定拥有真正的智能。最著名的就是“中文屋实验”（Chinese Room）。该实验由美国哲学家约翰·希尔（John Searle）于1980年在《行为与大脑科学》杂志上发表的《智力、头脑与规划》中提出。希尔是美国伯克利大学的教授，也是著名的哲学家。希尔认为不管计算机看起来多么智能，但计算机不拥有真正的智能和理解能力。他描述的“中文屋实验”就是这样一个场景：“一个人独自在一个封闭的房间，这个人对中文一窍不通，他所在的封闭房间中有海量的中英文词典。如果从门缝塞进来一个中文纸条，虽然这个人不了解中文，但他通过查词典、看资料，通过处理文字后，可以给出一个中文的回复，从而蒙骗了屋外的人，让他们误认为屋内的人是一个精通中文的人。”

希尔通过“中文屋实验”得出以下结论：一台计算机看起来是理解了信息，但其实它并没有真正理解。也正因如此，希尔断定图灵测试也是不充分的。在过去的20多年里，“中文屋实验”作为被学术界广泛讨论的人工智能哲学论证，引起了很大反响。

第1章 人工智能概述

1.1 什么是人工智能

第1章人工智能概述