热潮下的冷思考:当前人工智能技术的本质

在沉寂了数十年以后,人工智能借AlphaGo事件重新回到大众视野,并成为媒体吸引关注、业界吸引投资的“风口”。如前面所言,AlphaGo事件引发的全球广泛关注、密集的投融资、各国政府纷纷公布的顶层战略,这些无一不反映出人工智能的热度。在一些宣传口径中,人工智能似乎已经“无所不能”,人类社会被人工智能终结的日子马上就要到来。

毋庸置疑,人工智能已经成为最前沿的科技领域,将给经济发展、社会形态的方方面面带来颠覆性的影响。但过度、不切实际的宣传只会带来泡沫,只会导致科技政策与现实脱轨。目前,人工智能研究到底处于什么阶段?AlphaGo除了下围棋外,还能帮助我们处理什么难题?抛开那些不切实际的宣传,只有清晰地了解人工智能到底是什么,以及当前人工智能技术的本质,我们才能真正有效地利用人工智能这一利器,同时避免其带来的社会冲击。

◎人工智能与自然智能的区别

从本质上看,人工智能是指由人工创造的智能,与其对应的是生物进化所形成的“自然智能”(natural intelligence),特别是具有最高智慧的“人类智能”(human intelligence)。只看相同之处,无论是人工智能还是自然智能,一个智能体都需要具备感知环境的能力,将感知的信息进行处理、分析、决策的能力,以及实现既定任务的能力。

在智能的发生过程中,人工智能与自然智能在不同环节上有一些相似之处。在感知环节,自然智能依靠皮肤、眼睛、耳朵等器官获取温度、视觉、听觉等信息,人工智能则依靠摄像头、扫描仪等传感器获取外部信息。在行为环节,自然智能依靠肌肉、腺体等完成既定任务,人工智能则依靠机器手、显示器等完成既定任务。

人工智能与自然智能在智能的形成过程中,最大的不同之处在记忆、分析推理、决策这三个环节[1]。自然智能依靠的是大脑的生物神经系统,而当前的人工智能技术依靠的是GPU、TPU、ASIC等信息处理单元,云计算、雾计算以及卷积神经网络等算法。表面上看,两者实现的功能是相似的;实际上,两者产生智能的机理完全不同(见图1-4)。

首先,人工智能与自然智能的物理载体有本质区别。人工智能的物理载体采用的是冯·诺依曼架构的CPU、GPU、FPGA和ASIC等高性能处理器,以及高性能存储器等。这些物理器件都是基于经典图灵机模型创造的,因而从诞生时就局限于图灵机的理论边界之内。而自然智能的物理载体是由非线性动力学驱动的生物神经系统,其中的存储单元和计算单元在结构和功能上是一体的。

图1-4 智能的发生过程

资料来源:中国发展研究基金会。

其次,人工智能和自然智能的运算方式有本质区别。当前,常用的人工智能算法有数十种之多。每种算法都擅长解决某一类任务,但在不同任务之间的迁移能力却很弱。虽然人类大脑的运行机制尚未破译,但自然智能的小样本学习能力、不同任务间的迁移能力却是现阶段人工智能所望尘莫及的。

在仅有20瓦特左右功率的条件下,人类大脑可以在极短的时间内对通过视觉、听觉、嗅觉或触觉获取的信息迅速做出决策,并对未来做出预判。试想一下,当别人口里说出“榴莲”一词时,我们的大脑会瞬间联想到它粗糙的外壳、难以言表的气味和特殊的口感,甚至会很快做出购买榴莲酥的决定。此过程涉及的语音识别、语义处理、图像识别等任务,现阶段人工智能需要用不同的算法进行处理,且不同算法的运行过程无法有效结合。显而易见,现阶段人工智能的运算机制与自然智能完全不同。

目前,人工智能研究领域主要包括自然语言处理、语音识别、计算机视觉、规划与推理等。按图1-5粗略的划分,人工智能的各研究领域可以与人类智能中的各种能力一一对应起来。尽管人工智能的运算机制与人类大脑有本质不同,但其在任务目标上却与人类无限逼近。

总结来看,现阶段人工智能是对人类各类行为的模仿,主要利用深度学习等算法对结构化的海量数据进行统计学习,其内在机制与真正的智能没有关系。由此,我们可以引申出现阶段人工智能的重要特征:

●人工智能以人类智能为基准,主要目的是实现自主学习、知识运用、处理新问题等人类具备的基本能力。

●人工智能是人类智能的延伸,同样具有一定的感知、记忆、分析、决策和行为能力。

●人工智能的实现需要借鉴人类智能,但模仿人类智能并非实现人工智能的唯一方式。

图1-5 人工智能研究领域与人类智能的关系

◎深度学习是当前人工智能热潮的技术基础

一般而言,新技术在成熟应用前需要经历5个阶段:技术促动期、过高期望的峰值、泡沫化的低谷期、稳步爬坡期、实质生产的高峰期(传统Gartner技术循环曲线)。但人工智能在60多年的发展过程中,却经历了三次大起大落(boom-and-bust),其表现与传统Gartner技术循环曲线有着显著区别(见图1-6)。

图1-6 传统Gartner技术循环曲线VS人工智能关注度曲线

究其原因,主要是在三次人工智能浪潮中,人工智能的核心思想和底层技术有着本质上的区别,导致其应用场景范围、商业表现力存在显著差异。

第一次浪潮时间段约为1956—1974年,其核心是符号主义(逻辑主义),当时最大的成果是逻辑推理、启发式搜索。例如,1956年,卡内基梅隆大学的LT程序证明了《数学原理》第二章的38条定理;1963年,经过改进的LT程序证明了《数学原理》第二章的52条定理,该程序随后被改进成GPS。第一次浪潮中产生的方法可以说是基于知识驱动或模型驱动的,主要建立在基于“if-then”结构的人工设定的形式逻辑基础上[2]。这一阶段的成果几乎无法解决实用问题,计算能力也严重不足,导致人们对人工智能的未来产生失望,社会资本开始退出,政府资助不断下降,最终引发第一轮人工智能寒冬到来。

第二次浪潮时间段约为1974—2006年,这一时期符号主义与连接主义同步发展。在这一次浪潮中,专家系统和知识工程开始进入商用阶段,人工智能神经元网络方法亦开始盛行。1974年,保罗·韦伯斯(Paul Werbos)提出了反向传播算法(back propagation algorithm,BP算法),使得多层人工智能神经元网络的学习成为可能。1982年,约翰·霍普菲尔德(John Hopfield)提出可用作联想存储器的互联网络——Hopfield网络。80年代,新一波人工智能热潮开始兴起,成果集中在语音识别、语音翻译等领域,包括日本提出的第五代计算机等。尽管当时有商业应用的实例,但应用范畴却很有限。人工智能热潮在90年代开始逐渐消退。

第三次浪潮从2006年开始至今,其核心是深度学习的突破。2006年,杰弗里·辛顿(Geoffrey Hinton)、杨立昆(Yann LeCun)和尤舒亚·本吉奥(Yoshua Bengio)发表了多篇关于“深度神经网络”的文章。在不断发展的计算能力和大数据技术的加持下,人们发现深度学习技术可以解决前两次人工智能浪潮中解决不了的问题。2015年12月,微软亚洲研究院在ImageNet计算机识别挑战赛中凭借深度神经网络技术的突破,获得图像分类、图像定位以及图像检测全部三个主要项目的冠军。2016年3月,谷歌DeepMind开发的人工智能程序AlphaGo以4:1的战绩击败韩国围棋职业九段选手李世石,被认为是人工智能发展的重要里程碑。

如前所述,第三次人工智能浪潮取得了前所未有的成功。人工智能应用已经无处不在,如iPhone手机中的人脸识别、讯飞语音识别、AlphaGo围棋程序、自动驾驶汽车等。而深度学习无疑是这一次人工智能浪潮的技术基础。

理论上,深度学习是机器学习的一个研究分支,借鉴的是概率统计(建模、学习)的方法。机器学习是通过计算模型和算法从数据中学习规律的一门学问,在各种需要从复杂数据中挖掘规律的领域有很多应用,已成为当今广义的人工智能领域最核心的技术之一。近年来,随着算法的进步、算力的发展(GPU、FPGA、ASIC)和数据的指数级增长,多种深度神经网络在大量机器学习问题上取得了令人瞩目的成果,深度学习掀起了机器学习理论、方法和应用研究的一个新高潮。

作为一种深层的机器学习模型,深度学习的理论基础是人工神经网络。如图1-7所示,深度学习的发展最早可追溯至1943年心理学家沃伦·麦卡洛克(Warren McCulloch)和数学家沃尔特·皮茨(Walter Pitts)提出的神经元数学模型。此后,深度学习的发展经历了多个重要节点。1958年,弗兰克·罗森布拉特(Frank Rosenblatt)提出感知机模型;1974年,保罗·韦伯斯采用反向传播算法来训练一般的人工神经网络;1982年,约翰·霍普菲尔德提出Hopfield网络,这是最早的递归神经网络(RNN);1990年,杨立昆提出了深度学习常用模型之一——卷积神经网络(CNN);2006年,杰弗里·辛顿正式提出了深度学习的概念。

图1-7 深度学习技术发展历程

资料来源:Facio Vazquez.A weird introduction to deep learning.[2019-01-01].http://towardsdatascience.com/a-weird-introducition-to-deep-learning-782880369360.

深度学习与相关机器学习技术的进步,使得计算机不再需要明确的编程,而是通过“吸收和分析”海量的数据来完成自我训练,并可对未知的数据做出预测。自2006年诞生以来,深度学习持续受到学术界、产业界的广泛关注。从2011年开始,谷歌研究院和微软研究院的研究人员先后将深度学习应用到语音识别上,使识别错误率下降了20%~30%。2012年,杰弗里·辛顿团队在图片分类比赛ImageNet中,使用深度学习打败了谷歌团队,并将图片识别错误率降低了14%。

此后,深度学习在图像、语音、自然语言处理等领域获得了极为广泛的应用,奠定了新一轮人工智能发展的基础。在商业和媒体的宣传推动下,近几年来深度学习备受关注,与20世纪80年代的专家系统、日本第五代计算机开发几乎类似,被学术界和产业界视为实现人工智能长期愿景的主要途径。

◎人工智能研究处于什么阶段?

在达特茅斯会议10年后,人工智能因其技术进展与当初描绘的愿景相差甚远,受到了产业、学术、政府各界的广泛批评,人工智能研究经历了第一轮寒冬。在这段人工智能寒冬期中,不少哲学家开始对人工智能的长期愿景进行深入思考。20世纪70年代,美国哲学家约翰·塞尔(John Searle)所提出的“强人工智能”(strong AI)和“弱人工智能”(weak AI)对后世有较大影响。在此基础上,牛津大学哲学家尼克·波斯特洛姆(Nick Bostrom)还提出了“超人工智能”(super AI)的概念。

弱人工智能:模拟人或动物解决各种智能问题的技术,包括问题求解、逻辑推理与定理证明、自然语言理解、专家系统、机器学习、人工神经网络、机器人学、模式识别和机器视觉等。一般而言,弱人工智能是只擅长处理某一单方面任务的人工智能,也可称为“专用人工智能”。

强人工智能:具有自我意识以及自主学习、自主决策能力的人工智能,是人工智能发展的终极目标。强人工智能在各方面都能与人类智能比肩,人类能从事的脑力活动它都能从事,也可称为“通用人工智能”。目前,有关强人工智能的研究大多集中于伦理道德层面,霍金、比尔·盖茨、马斯克等人都曾表示对人工智能具有自我意识的忧虑。

超人工智能:在几乎所有领域都比最聪明的人类大脑聪明很多,包括科学创新、通识和社交技能。波斯特洛姆认为超人工智能在几乎所有领域远远超过人类,具备远超过强人工智能的强大能力,从而会给世界带来存在性风险:智慧生命灭亡或永久失去未来发展潜能。

在一些舆论中,人工智能超越人类智能的奇点(singularity)似乎马上就要来临,强人工智能的实现似乎就在眼前(见图1-8)。但实际上,人工智能的发展还处在弱人工智能阶段的初期。尽管在目前,以深度学习为基础的弱人工智能技术在自然语言处理、机器翻译、图像识别、语音识别等方面取得了巨大成功。然而,深度学习存在难以解释(黑箱)、透明度低、需要大量数据和计算资源、易受对抗样本影响等一系列问题,无法在军事、医疗等关键领域真正替代人类决策。

图1-8 人工智能超越人类智能的奇点

资料来源:Holly Olivia.Technological singularity:from fiction to reality.[2019-01-01].http://innovationforevolution.wordpress.com/2014/10/29/technological-singularity-from-fidoon-to-reality/.

在2017年神经信息处理系统大会上,谷歌工程师阿里·拉希米(Ali Rahimi)在获奖发言中称:“深度学习成为今天的炼金术。”暂不论该观点的合理性,深度学习研究中理论的匮乏已经得到了相当广泛的认可。深度学习的理论基础是人工神经网络,而人工神经网络的理论研究早在机器学习的浪潮出现前就开始了。然而直到今天,神经网络的相关理论还较为原始,解释力不足、资源消耗过大等问题依然困扰着这一领域。

在过去60年的发展历史中,人工智能的研究领域不断扩大,并且与计算机科学、数学、物理学、生物学、逻辑学等学科紧密相连。目前,人工智能的研究范围包括机器学习、自然语言处理、语言处理、图像处理、智能搜索、知识表示、知识推理与规划等诸多领域。我们可以将其归纳为6个大类:

(1)计算机视觉(图像分析、视频分析等);

(2)自然语言处理(语音识别、语义分析等);

(3)机器学习(监督学习、半监督学习、强化学习、深度学习等);

(4)博弈与伦理(多代理人交互、对抗与合作等);

(5)机器人学(人机接口系统、运动规划、任务规划等);

(6)认知和推理(包含各种社会常识、物理常识等)。

但遗憾的是,自20世纪80年代以来,人工智能的研究被划分为以上几大学科,相互独立发展。这种领域的分化,直接造成了人工智能研究思路“混乱”的局面。目前,学术界和业界基本抛弃了以逻辑推理和启发式搜索为主的研究方法,深度学习这一机器学习的分支成为人工智能领域的热门方向。这一现状,削弱了各研究领域的交叉性,不利于人工智能基础理论的进一步发展。

总体来看,当前的人工智能仍然处于专用人工智能阶段,仍然处于弱人工智能的初级阶段。目前有关人工智能的研究多集中于深度学习领域,但深度学习的理论基础仍然薄弱,技术瓶颈或许会导致人工智能的应用受到限制。一方面,我们应该肯定当前人工智能技术带来的颠覆性;但另一方面,我们也应该对人工智能的发展阶段了然于胸,如此才能更合理地指导人工智能发展。


[1]中国发展研究基金会.投资人力资本,拥抱人工智能:中国未来就业的挑战与应对,2018.

[2]黄璜.人工智能之辨:计算本质、目标分类与议题划分.电子政务,2018(3).