- 智能化变革:人工智能技术进化与价值创造
- 李修全
- 4661字
- 2021-12-10 19:40:09
2.4 不同维度看智能蝶变
人工智能从20世纪中期一路走来,这门学科的具体目标和内涵也在发生变化。随着智能技术的落地和社会智能化水平不断提高,科技在改善人类生活体验的同时,让人们对智能的理解也在不断提升,越来越多的智能技术被人们归为像计算器一样的常规技术。
十多年前,手写汉字识别还是人工智能学术界尚在挑战的问题,而当前已经很少有人再将手机上的手写识别称为人工智能技术了,而只是输入法之一。往往一项能力一旦实现,人们就不再觉得它很“智能”了,可能它就会被人们排除在人工智能范围之外。
约翰·麦卡锡是达特茅斯人工智能会议发起组织者之一,也是人工智能概念的最早使用者,据说他总抱怨,“一旦一样东西用人工智能实现了,人们就不再叫它人工智能了”,“人工智能的所有主要问题都是难解的”。这给人工智能发展带来不断前进的持续需求,也给如何对人工智能技术做出评价带来很大难度。
现在有关人工智能的概念很多,比如弱人工智能、强人工智能、感知智能、认知智能、专用智能、通用智能等,它们之间相互重叠交叉,有些提法也比较模糊。这主要是人们从不同维度看待人工智能造成的。人工智能在不同方面都在持续进化发展,我们可以用一张不太严谨的路线图(见图2-4),大致勾勒一下人工智能阶段性发展历程。
图2-4 智能形态进化示意图
综合起来看,从当前到至少2030年,人工智能在不同维度都将发生关键性变革,从不同方面推动能力实现跃迁。这段时间将是人工智能发展的技术创新活跃期,也将成为人工智能从弱向强过渡的关键时期。
具体从以下几个维度作以分析说明。
(一)从智能问题类型的维度
从人工智能能够解决的智能问题的类型角度看,人工智能可以划分为计算智能、感知智能和认知智能三种类型。当前处于感知智能日益成熟,认知智能面临突破的阶段。
1.计算智能
通常认为计算智能是指早期发展起来的主要通过发挥计算机迭代计算的算力优势来实现人工智能的方法,包括遍历计算、启发式搜索、模糊计算、模拟退火等,1997年战胜世界冠军卡斯帕罗夫的IBM“深蓝”往往被认为是计算智能的典型代表;也有很多通过学习借鉴自然界中生物行为或进化机制而设计出来的计算智能方法,比如蚁群算法、粒子群算法、遗传算法等。计算智能被大量应用于解决博弈、路径规划、复杂业务调度等多目标优化或高维空间求解问题。
2.感知智能
感知智能是基于视、听、传感等感知数据,使机器具备类似人类的感知、识别和交互能力,包括语音识别、人脸识别、环境感知等。由于感知智能需要大量的视频、音频、传感器数据,在人工智能发展早期,计算机的存储能力和计算能力都无法支撑庞大的数据运算,学习模型和算法也难以处理海量数据集,感知智能发展缓慢。
深度学习最擅长从大量的非结构化数据中发现模式,图像、声音、视频、文本等各种类型的交互数据都非常适合于深度学习,因此基于深度学习的模式识别近年来在语音识别、图像识别、环境感知、人机交互等感知智能应用中得以大展身手,成为当前人工智能研究最大的热点。2015年,微软的图像识别系统错误率降低到3.57%,首次超过人类水平。2016年,微软的语音识别系统将词错率降低至5.9%,标志着人工智能的语音识别能力已经高于世界上绝大多数人,与人类专业高手持平。2019年,谷歌用AI诊断根据患者胸部CT图像发现更多没被发现的早期肺癌病人,无论是和单个医生相比,还是和某一科目的医生相比,这项研究中模型的准确度都相当高,超越了人类水平。
目前,语音识别、人脸识别等感知智能技术在识别精度上已经赶上甚至超过人类评测水平。尤其是机器具备稳定性、准确性、实时感知、快速反应等超过人的先天优势,远红外、光谱成像新技术可实现弥补人类视觉能力缺憾的超人感知能力,使得感知智能率先突破商业化门槛,并正在成为当前人工智能产业化的主要驱动力量。感知智能在安防、医疗、汽车、家居各个领域快速开拓,已经形成大规模产业化发展态势。
3.认知智能
从感知智能向认知智能的提升是人工智能发展的必然趋势和必然要求。目前从感知智能的语音识别、图像识别向图像内容理解、语义理解、演绎推理等更高级的认知功能逐步探索,但目前主流技术路线尚不明晰,知识图谱、预训练深度模型等相关技术的发展,都将有助于认知智能的突破。
认知智能的发展需要完成大量理性思维任务,包括理解对话的语义、理解图像内容、情感计算等。尽管困难重重,但学术界、产业产业界都在持续推进。IBM努力打造“沃森”(Watson)认知系统探索认知智能技术路线,不仅在智力竞猜节目中击败人类选手,也在医疗诊断领域探索认知技术,基于大量医疗专家的经验和知识提出的乳腺癌治疗方案与专家方案的一致率达到93%;谷歌发布的BERT模型在11种不同自然语言处理测试中创造了最佳成绩;“微软小冰”通过理解对话的语境与语义,向超越简单人机问答的自然交互发展。
认知智能相对感知智能更具科学挑战性。感知智能的率先突破,也为下一步挑战逻辑推理、自主决策等高级认知智能提供了理论储备和实践经验。而未来随着认知智能问题的持续突破,会激发出新一波技术的产业化红利。
(二)从智能生成范式的维度
基于符号逻辑和知识规则的智能生成范式曾在前两轮发展热潮中引领人工智能发展。当前,数据智能成为主流,“大数据+深度学习”的数据深度建模成为当前智能计算的主流范式。
遍布海陆空的传感器、虚拟和物理世界的人们的行为数据、各行业的业务数据等,为算法开辟了施展潜力的广阔空间和舞台。然而大数据智能的模式机理还是基于数理统计,对于解决感知类问题、模式识别类问题优势突出,但是进一步向认知能力、推理能力去推进就会面临很多瓶颈和制约。通过模型方法创新实现数据驱动+知识驱动,将推动人工智能突破现有能力制约。
已经发展的人类知识表示和嵌入方法将在新计算环境下重新焕发生机活力,帮助突破现在数据深度建模方法知识表示和推理能力不足、可解释性薄弱等弊端;随着基于海量数据的自动知识抽取方法的快速发展,机器将自主发现并形成大量有别于甚至超越人类现有知识的机器知识,实现基于知识的学习和推理;借助脑神经机理和脑认知科学的新发现,设计具备概念表示和知识建模能力的类脑认知计算模型,有望从根本上实现机器认知能力提示,将人工智能解决问题的范围从感知智能向认知智能拓展。
美国国防高级研究计划局(DARPA)认为,人工智能发展将经历三个波次:第一波次是人工智能发展初期基于规则的时代,专家们会基于自己掌握的知识设计算法和软件,这些AI系统通常是基于明确而又符合逻辑的规则;在第二波次AI系统中,工程师和程序员们不必再费心教授AI系统完全遵守规则,相反,他们可以开发特定类型问题的统计模型,然后利用各种样本数据训练模型,深度学习是其典型代表;在尚未到来的第三波次中,人工智能系统本身能构建模型,以解释它们的工作原理,即自主发现并形成决策过程的逻辑规则。
(三)从底层计算架构维度看
人工智能发展前50年的主要成果,基本都表现为经典的冯·诺依曼计算机上单机运行的智能算法形式。
大数据驱动的深度学习具有计算密集、存储密集的特点,云端高性能集群算力成为智能算法运行的强大支撑,当前阶段主流AI系统都已运行于“云端”。同时智能计算前移、就近提供智能计算能力正在成为当前人工智能发展的另一新趋势,人工智能向“云边端”混合架构的分布式智能计算形态演化。
然而云边端的各部分硬件基础仍然是基于冯·诺依曼经典计算机体系的,其计算能力依然受限。中国工程院高文院士和北京大学黄铁军教授都曾提出智能为用、机器为体(5)的观点,认为如果计算硬件层面的 “体”彻底更换,可能为强人工智能的实现带来新的机会和曙光。未来从类脑研究领域发展起来的神经形态计算芯片,以及从量子计算领域发展起来的量子智能处理器,将有可能与经典计算优势互补,甚至整体替代冯式计算架构,为智能计算带来新的能力突破,从底层推动智能计算形态变革。
(四)从综合智能水平的维度
弱人工智能、强人工智能和超级人工智能是从整体智能水平角度的综合性概念划分。从目前来看,人工智能发展正处于弱人工智能向强人工智能过渡的阶段。
弱人工智能就是当前在冯·诺依曼计算机体系架构基础上,通过神经网络、支撑向量机、演化计算、强化学习等智能模型和方法,使机器能够解决学习、分类、预测、聚类、优化等问题。弱人工智能无法像人类一样通过经验积累实现认识深化和升华,不能灵活、自主地综合各方面知识解决问题,也不具备遇到问题时灵光一现的突发灵感或创造力。
未来,强人工智能可以胜任更多类似人类智慧的认知任务,实现基于认知学习与决策执行的能力,在许多智能方面都能和人类比肩。此时,计算机能够真正理解人类的语言,感知人类的情绪。强人工智能一直是人工智能学科的核心目标,也是人工智能设计者的最初理想,有不少科学家预计其将在2045年左右实现(6)。在一次通用人工智能(AGI)会议上,与会学者和专家对出现强人工智能的预测时间汇总结果与这一认识保持了一致性。
也有专家认为,随着强人工智能的进一步发展,有可能出现具有自我意识、类人情感的超级智能,在包括创新、创造、创意等各个领域均有望超越人类。但目前看来,超人工智能仅存在于一些影视文学作品中,能否实现仍未取得共识,离我们还很遥远。
(五)从通用能力的维度
当前还存在专用智能/通用智能的概念,从技术演进时间历程上看,可能与弱人工智能/强人工智能的实现时间有很大重叠度。两者视角不同,比如强人工智能更强调智能水平的深度;而通用人工智能更强调从智能水平宽度角度进行评价。也有很多学者认为,两者关联性很强,甚至概念上可以互相替代。
专用人工智能,主要指能够实现狭义定义任务或者功能的智能模型或算法,如计算机视觉、语音识别、环境感知、智能控制等。通用人工智能(AGI),则指具备灵活性和通用性的人工智能系统,能够跨领域解决问题。根据实现难度不同,通用人工智能可分为“大通用”和“小通用”,“大通用”是建立实现感知、知识推理、运动控制等各类大任务的通用方法;而小通用则指针对上述某类智能任务,建立适应各类场景的通用能力。比如,目前的医疗影像诊断系统有专门诊断肺结节的,有专门诊断血管疾病的,不同智能系统数据类型、训练样本都不相同,看肺结节的系统不能看血管病变;身份认证系统有采用指纹、人脸、声音、虹膜的,目前也是各不相通的专用人工智能。
智能的深度与宽度是相互交织相互影响的,通用智能的实现需要以认知智能为基础。通用智能并非将各专项智能用一台更大的机器集成起来,通用性的实现可能需要以高层级的知识抽象和知识处理能力为基础。
在人工智能发展的第一次高潮期,人们对通用智能就产生了极大兴趣。自1957年,纽厄尔(Newell)、肖(Shaw)和西蒙(Simon)等人就开始采用符号逻辑语义技术路线研究一种不依赖于具体领域的通用解题程序,称之为GPS(General Purposed Program),这实际上就是尝试从高阶认知的角度对实现通用智能的探索。
当前数据驱动的专项感知智能仍是单媒介方式,比如基于视频、音频或图像,人类在感知事物的时候是以多媒介综合感知的,比如小孩学习认识猫,他既能够感知猫的样子,也能够记住猫的声音,还能够触摸它的皮毛,从而综合判断那是不是一只猫。
跨模态的感知很难在数据层面实现,因为数据结构、特征类型、计算模式都不一样,实现感知的通用性也需要在更高认知层进行,需要在能够进行概念统一表征的更高知识抽象层实现,这就需要对图像内容、文本内容和语音内容的理解。要让计算机认识老虎,像素和语音的字符无法直接跨媒体融合,需要让计算机知道这是一只老虎,而非一组向量。停留在大数据阶段的人工智能,距离认知智能和通用智能还有相当距离,知识抽取和表示有望为实现模型算法迁移和提升通用化能力提供重要帮助。