- 趣读数字经济
- 李晓雨 冯丽伟 沈根海
- 3802字
- 2024-12-31 19:48:47
1.1 自学成才的人工智能
先秦时期的道家经典《列子·汤问》中记载了一个“偃师造人”的故事:周穆王西游时遇工匠偃师献宝,宝贝是一个木偶歌舞艺人,体态、相貌极似真人,时而曼声吟唱、应节合拍,时而翩跹起舞、轻盈美妙,动作千变万化,尤胜真人。这是中国最早的关于机器人的科幻故事,寄托了古人对拥有智能器械的美好愿望。
人工智能(artificial intelligence,AI),是一门研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的技术科学。
具体来说,人工智能研究智能的实质,制造出具有一定智能的机器,承担以往具备人的智力才能胜任的工作。简单来说,人工智能就是试图制造一种具有人类智慧且能充分理解人类意图的工具。
过去的数十万年,无论人类发明了什么工具,都要主动学习它、使用它;而人工智能会主动学习如何更懂人类需求,并满足人类需求。举个例子,普通的车需要人类学习如何驾驶,而无人驾驶汽车会自行学习如何更安全、快捷地送乘客到达目的地。
现在的人工智能,可以看作你的私人秘书兼高参,可以帮你做PPT、写文案、翻译、画图、谱曲等,还可以帮你整理、分析数据并做出预测、辅助决策,甚至可以帮你开车、做家务等,不提要求、不拿工资、24小时陪伴,虽然能力还差强人意,但一直在提升中,直到完全合乎你的心意。
这也是赋能。试想,一个人是单枪匹马时厉害,还是有一群帮手辅助时厉害?
所以,人工智能寄托了人类一直以来的一个梦想:希望制造一种工具,像人一样聪明,帮助自己完成所有事情,完全遵从自己的意志,又不存在主仆关系。
这么完美的工具,要如何制造呢?
1.符号主义的成功:深蓝大战卡斯帕罗夫
方法:先由专家总结出知识和规律,灌输给计算机,计算机再按照专家设定好的逻辑系统推理、判断并执行。
举个简单例子:专家先总结出输出y和输入x存在y=(2x+3)×6的函数关系,灌输给计算机,然后令x=1,2,3,…,n,让计算机求y的值。
此时的AI还不能自己学习,需要人教给它所有的规则。
这是符号主义学派的做法。
对人工智能的研究逐渐分化为三大学派:符号主义、连接主义和行为主义。
符号主义又称逻辑主义或计算机学派。符号主义理论是一种基于逻辑推理的智能模拟方法,认为人工智能必须依托于逻辑系统,每一个判断、动作都基于强有力的逻辑关系,是对预设的准确反馈。
符号主义理论的典型应用是在1997年,IBM的深蓝打败人类国际象棋冠军卡斯帕罗夫。深蓝主要是用人类专家提炼出来的逻辑和人类进行对决。
符号主义理论的优点是能够模仿人类的推理和思考的过程,决策具有可解释性,但也存在很多缺陷。首先,根据哥德尔不完备定理,逻辑上找不到能够表述一切的逻辑体系。其次,本质缺陷还在于符号主义理论只考虑理性认知的智能,忽略了人类智能的感性认知。
比如在语义理解方面,语言专家们虽然总结出了主、谓、宾、定、状、补等语法规则,但不可能像数学公式一样,列举所有的情况。
举个例子,你和女友约会,女友说:“如果你早来,我没来,你等着;如果我早来,你没来,你等着!”
这理性吗?有什么逻辑?符号主义理论下的人工智能,像一个脑筋比钢筋还直的“钢铁直男”,一脸迷茫,将完全体会不到女友的言外之意。
如何教会机器,让它能理解并做出正确应对?语言专家们多番尝试后,纷纷表示,太难了。
不教了,自己学去!
2.举一反三的机器学习
如何自学呢?
在上一小节的例子里,输出y和输入x存在的函数关系y=(2x+3)×6,是人类专家总结的。现在,让人工智能自己推导出x与y的函数关系,前提是把大量已知的x和y数据扔给它。
举个例子,老师问同学:
“当x=1时,y=30,求x与y的函数关系f(x)。”
“y=30x,30倍关系。”学生A抢答。
“还有y=x+29,y=2x+28,y=3x+27……”看穿一切没那么简单的学霸B答道。
“对,再补充一组数据,当x=2时,y=42。”老师道。
“y=(2x+3)×6。”
“那么当x=3时,y的值是多少?”
“54。”
人工智能系统就这么实现了一次机器学习的过程。从数据中归纳出知识,再用知识解决新问题。
(1,30)和(2,42)是我们“喂”给人工智能系统的训练数据,f(x)是人工智能系统从训练数据中归纳出的知识,这一知识被用来解决x=3时的问题。
我们也发现,如果训练数据过少,就得不出真正的f(x),也就无法从中归纳出正确知识获得智能。这就是人工智能需要大数据的原因。
此时再看机器学习的定义:机器学习是一种从数据中自动学习模型的方法,可以从数据的分析中发现规律和模式,以便对未知数据做出预测或决策。简单理解,就是把历史数据“喂”给机器,让机器自己从数据中找规律。
于是,人类不必多说话,只向“无知”的人工智能扔了一堆大数据。
3.连接主义的胜利:阿尔法狗战胜李世石
作为人工智能的顶流——机器学习,成名之战是在2016年,阿尔法狗(AlphaGo)打败当时的世界围棋冠军李世石。
阿尔法狗前期被输入了3000多万步人类围棋大师的走法,并在此基础上利用算法自我博弈,产生了数以千万计的海量“机器棋局”大数据,通过深度学习,从中训练出一套走棋程序(规则),最终战胜了李世石。
阿尔法狗能够实现机器学习,主要归功于连接主义。
连接主义,又称仿生学派或生理学派。连接主义理论源于仿生学,特别是人脑模型的研究,采用基于神经网络及网络间连接机制与学习算法的智能模拟方法,强调形成类似于人脑的神经网络,靠人工神经网络形成意识自行思考。
人工神经网络是什么呢?
4.人工神经网络让计算机也有“脑回路”
人工神经网络,是一种能够学习和适应不同数据模式的机器学习算法,它从模仿生物的神经元开始。
人们发现,生物的神经元细胞是生物智能的基本来源。神经元细胞比较特殊,一般长有很多树突(输入部分)和一根轴突(输出部分)。轴突边缘有很多突触,可以连接到其他神经元细胞的树突上(一个神经元的输出成了另一个神经元的输入)。很多神经元细胞这样互相连接,构成了复杂的生物神经网络,实现信息的处理和传递,使得生物有了智能。
人们在计算机中通过编程的方式模仿生物神经网络,实现了人工神经网络。可以这样理解,单个人工神经元是一种运算结构,有一个或多个输入,通过非线性函数变换(该非线性函数在学习过程中是可变的)得到一个输出。而这个神经元的输出可以是另一个神经元的输入,许多单一神经元连接在一起,构建起复杂的网络,通过复杂网络的逐层计算、归纳,逐步将抽象的原始数据变得具体。
这种人工神经网络可以看作一个非常大的数学模型,里面有很多参数,达到一定规模,就会表现出类似于生物智能的现象。
图1-1是一个简单的人工神经网络结构。
图1-1 一个简单的人工神经网络结构
图中,L1层是“输入层”,有3个“输入单元”,标“+1”的圆圈称为“偏置节点”,不计在内。L3层是“输出层”,有1个“输出单元”,复杂的神经网络的输出层会有多个“输出单元”。L2层叫作“隐藏层”(一般视为黑匣子,其值无法集中观测到),有3个“隐藏单元”。图1-1中只有一个隐藏层,但复杂的神经网络会有很多隐藏层。hw,b(x)就是神经网络算法提供的一种复杂的非线性假设模型,具有参数w、b,可以用此参数来拟合任意数据。
5.可拟万数的万能近似定理
再回到上个例子:
“很好,B同学通过历史数据(1,30)和(2,42),归纳出了y=(2x+3)×6的函数关系,”老师称赞后,随即话题一转,“如果再补充一组数据(3,55)呢?”
“x=3时,y=(2×3+3)×6,y不应该是54吗?”学霸B也困惑了。
“54只是预期输出,55才是现实结果。
“这说明x、y还有更复杂的函数关系,需要不断调整f(x)的参数,让预期输出和真实结果55无限接近。
“在y=ax+b的函数关系中,a和b是需要不断调整的参数。”老师解释道。
人工神经网络的功能就是通过调整各层的参数,拟合出任意复杂度的函数。
人工神经网络是有数学原理支撑的,一般称之为万能近似定理(universal approximation theorem)或万能逼近定理,即只要激活函数(如logistic sigmoid激活函数)选择得当,神经元的数量足够多,至少具有一个隐藏层的神经网络,就能以任意的精度近似闭区间上任意一个连续函数。
简单来说,人工神经网络可以学习到输入数据与输出之间的复杂非线性关系,从而实现对目标函数的逼近,不管这个函数的表达有多么复杂。
当然,这需要人工神经网络有足够的深度。
6.深度学习让“脑回路”更深
显而易见,要解决的问题越复杂,需要的神经元就越多,构建起的人工神经网络就越复杂。
人脑的神经元可以连接起来构建复杂的三维立体结构,但人工神经网络还只能做到二维,并且每层的神经元只能连接下一层的神经元,不能跨层连接。这样一来,层数多了,“深度”也就有了,也就得出了深度学习的概念。
深度学习作为一种机器学习方法,核心就是人工神经网络。包含多层的人工神经网络就是一种深度学习结构,深度学习也被称为深度神经网络。
总之,深度学习的“深度”,可以理解为从人工神经网络的输入层到输出层所经历层次的数目,即隐藏层的层数。越复杂的问题,需要的层次越多。
比如,阿尔法狗的策略网络包含13层卷积神经网络,每层都包含数百个神经元。
研究表明,人的大脑皮层的沟壑越多,就越聪明;后天的知识积累越多,沟壑就越深。爱因斯坦比普通人的大脑沟壑都要多且深,也算同理。
一般来说,人工神经网络层数越多,则非线性表达能力越强,拟合能力越高,深度学习性能越好。
简单总结来说,机器学习、神经网络、深度学习是逐次包含的关系。人工神经网络通过模拟人脑神经结构,满足了机器像人一样学习的硬件条件;深度学习通过人工神经网络来实现,提供了机器学习的方法;大数据提供了足够多的学习资料;再有支持众多人工神经网络节点运算的算力资源,机器就能搬个小板凳安静地开始自学成才了。