人工智能优先的世纪

人工智能优先的世纪始于人工智能萌芽的1950年,并预测将于2050年左右结束,届时人工智能将充分融入所有的行业,因此,现在开始在你的行业中应用人工智能,还不算太晚。

人工智能优先的前半个世纪:1950年至2000年

如果说前五十年,即1950年至2000年,人工智能只是在实验室里发挥作用的话,那么,下一个五十年则是它为人类、商业和社会大显身手的时候。人工智能的发展花了大半个世纪的时间才达到了现在的水平,因此,对于最近的创新,我们还是应该抱持更加宽容的态度,同时展现出将人工智能与商业战略相结合的强烈意愿。很长一段时间以来,我们一直认为人工智能就在眼前。但事实上,它才刚刚开始,我们才刚刚将实用人工智能带入现实世界。

在过去的半个世纪里,人们一点一点地构建着人工智能,下面讲的就是他们的故事。正是这些人将人工智能带到了今天的水平,而你们将在这本书的帮助下,在下半个世纪把他们的工作推向新的高度。

理论基础

人工智能的基本思想发端于20世纪50年代。通过人们不断地开展实验,与志同道合者一起研究方程式,一批批伟大的思想家试图为人工智能下定义。

数学家沃伦·麦卡洛克(Warren McCulloch)和神经学家沃尔特·皮茨(Walter Pitts)写下了第一个代表我们思维活动的方程式。麦卡洛克曾混迹底特律的街头,而皮茨则曾就读美国东海岸的一所私立学校。两人都是控制论运动的创始成员:控制论是一门关于机器和生物之间交流与控制的科学。沃尔特是一个特别了不起的人,12岁时曾被英国伟大的哲学家和数学家伯特兰·罗素(Bertrand Russell)邀请去剑桥大学读书,因为他之前阅读了罗素撰写的被视为数学基础的三卷本《数学原理》(Principia Mathematica),并将其中的错误进行更正后写信寄给了他。沃尔特15岁时离家出走,去美国芝加哥大学看望罗素,从此再也没见过他的家人。

尽管沃伦比沃尔特大24岁,但他们一起花了很多时间参加各种协会的活动,或通过像麻省理工学院(MIT)这样的机构,了解人类的思想,当然,还一起喝了很多威士忌。两个人共同建构了一种被称为阈值逻辑单元(Threshold Logic Unit,TLU)的重要函数模型:一种描述人脑细胞或神经元的数学模型,用于解释大脑的运算方式。这个关于我们自己的智能原子单位模型,为创造人工智能提供了起点。

神经科学家、计算机程序员和来自不同学科的研究人员组成一个个小组,讨论我们大脑的工作原理,以及如何将其功能先呈现在纸上,然后再通过计算机程序展现出来。这些研究借鉴了逻辑学、计算科学、神经科学、通信等众多学科的概念。1956年,达特茅斯学院的一个小组创造了“人工智能”一词;康奈尔大学的一个小组发明了一种感知器算法,提高了早期算法模拟人类神经元的能力;斯坦福大学的一个小组将这些神经元连接在一起,形成了一个早期的小型人工神经网络。

这50年时间里,人们开始考虑如何在实验室之外的地方使用人工智能,艾伦·图灵(Alan Turing)提出了一种智力测试方法,用来确定机器智能是否可以像人类一样进行对话。他的发现包括神经系统的不同部分各自能够进行一定程度的计算。

向实践过渡

第一个十年为人工智能发展奠定了基础,但实践才刚刚开始。

20世纪60年代,关于思维的研究发展到了感知和表达阶段。麻省理工学院、美国国防部国防高级研究计划局(DARPA)和国际商业机器公司(IBM)的研究人员,对神经元在感知环境刺激并做出反应的运动方式进行了研究,编写了计算机程序来理解自然语言、视觉和推理。大约在这个时候,计算机学会了下棋——在20世纪余下的时间里,这件事引发了人们持续的关注和痴迷。

20世纪70年代,政府削减了对该领域的资助,因为他们认为开发通用人工智能是一个棘手的问题,可能会导致一连串的大麻烦。这与其说是一个技术问题,倒不如说是一个政治问题:该领域承诺的过多,兑现的太少。为了应对这一局面,相关公司开发了第一批机器人、语音识别系统和语言翻译程序。他们还预测人工智能将与另一个趋势相互交叉,这一趋势就是过程自动化。过程自动化的基础是19世纪末一位名叫弗雷德里克·W.泰勒(Frederick W. Taylor)的工程师开发的工厂管理系统。该系统通过将制造过程的每个步骤分解为专门任务,由同一个人重复执行,从而提高效率。这种趋势一直持续到20世纪,此时专门的任务可以用计算机代码编写,然后由计算机反复执行。IBM公司五名前雇员于1972年创立的德国软件公司思爱普(Systems Applications and Products in Data Processing,SAP),开始通过向大型制造公司销售电脑赚了很多钱,这些电脑可以用来做一些诸如在生产过程中记录库存之类的工作。美国军方更进一步使用电脑来改善后勤工作,例如,他们在战争期间使用人工智能在各个基地之间分配关键物资。随着公司和政府使用人工智能实现制造流程自动化以及对供应链进行优化,智能系统被逐渐构建起来。

投资促进了汽车业(1995年)、国际象棋(1997年)和宠物狗(1999年)等方面的创新。这些突破引人注目,因为它们将人工智能带入了公众视野,分别应用于一个机器人(该机器人能够根据自己所看到的东西来改变行为)、第一辆自动行驶1000英里(1英里≈1.6千米)的汽车,以及一个能够对人类表情做出反应的“宠物”机器人。

那一时期的情形跟20年后的今天非常相似:有证据表明,人工智能在现实世界中的应用——为了娱乐,同时也为了提高企业的效率——促进了投资。然而,人工智能的投资在经历了20世纪90年代显著的发展之后,并没有促使许多公司采用人工智能。这一时期,军方、IBM和索尼公司是为数不多的几个拥有足够的数据、人才和计算能力构建人工智能的实体。

这些公司有着巨大的领先优势,但当时的计算能力和网络技术限制了它们的发展。数十年的研究催生了可编程的人工神经元。然而,这些可编程的人工神经元是单一的,因此功能有限,只能进行数据输入、计算、数据输出。将神经元串联成大型网络需要巨大的计算资源,因此,这一方法让人觉得非常不切实际。设计和运行这样一个系统无疑是一项艰巨的挑战。

新千年伊始,人工智能研究人员在将神经元串联成一个网络方面取得了突破。加拿大计算机科学家约书亚·本吉奥(Yoshua Bengio)设计了一个基于神经网络的语言模型,该模型可以在一种语言中依据一个单词与其他单词的相邻关系,在其词汇中找出下一个可使用的最佳单词。出生于英国的计算机科学家和心理学家杰弗里·辛顿(Geoffrey Hinton),开发了一种将多层神经元连接在一起的神经网络——深度学习的先驱。重要的是,研究人员致力于让这些神经网络在现有的计算机芯片上高效运行,特别是在用于计算机图形图像的芯片上运行,因为它们特别擅长并行运算许多数值。研究结果出现了一个可以训练的神经网络:可编程神经元,连接在一个网状网络中,将计算结果传递到位于其下方的另一个网络上——所有这些都是在一个芯片上计算的,该芯片可以在合理的时间范围内执行必要的操作,只需几天而不是几个月时间。

电脑便宜了

科技界经常发生的事情是,一个领域的创新引发了另一个领域的创新。计算机科学中的分布式系统使我们能够制造出体积大、功能强、价格低的计算机。这一进步是促进人工智能发展的第一个关键因素。IBM和微软等大型科技公司让客户能够访问云计算集群,随着这些集群的扩大,计算能力变得越来越便宜。发达国家中的绝大多数人在工作时都有一台电脑可以随身携带。使用这些计算机和互联网时产生的数据是人工智能发展的第二个关键因素。拥有更多计算能力和数据的研究人员对人工智能重新产生了兴趣。这些神经网络所具有的部署能力,已经足以使其嵌入日常产品中,从手机键盘到购物网站,再到亚马逊的Alexa或苹果HomePod等家居设备,为执行我们的每一个命令做好了充分的准备。

我开始研究基于人工智能的技术,大约是在研究人员再次对它产生兴趣的时候,也就是在云计算建立之后,并有大量数据进入其中的时候。当我意识到会有更多的数据进入其中,而且需要计算时,我创办了一家公司,帮助世界上最大的旅游公司整理消费者通过手机和社交媒体生成的所有数据。该领域取得的进步和深层神经网络的创新令我惊叹不已。这是一项可以改变一切的技术,值得花几十年时间去研究探索。事实上,我加入了第一个完全专注于人工智能的投资基金Zetta Venture Partners,该基金于2013年推出——同一年,一整泽字节(Zettabyte)的数据(1021字节,或10万亿亿字节)首次在互联网上传播。我们已经审核了数万个创建人工智能优先公司的推介,支持了许多开创性的公司,并且成为世界上最大的机器学习(Machine Learning,ML)工程师社区——Kaggle——的最大投资者。作为一名风险投资家,我的工作是尽我所能预测技术前沿何时会与现实结合。用我的职业生涯打赌,关于人工智能,时间就是现在。自那以后,Zetta Venture Partners一直为第一代将人工智能应用于现实世界的公司提供支持,并在“关键时刻”吸取了教训。这本书将与大家分享这些教训。

人工智能的下半个世纪:2000年至2050年

过去几个世纪的实践表明,当一个领域与另一个领域交叉时,它就会向前发展:哲学和数学交叉产生物理学;当工业工程和电气工程交叉时,工厂的生产效率得到了显著提高。如今,人工智能正在与分布式系统交叉,我们因此能够在功能强大的计算机上运行机器学习模型,并对大量数据进行处理。本书将提供投资基础设施的最佳实践,推介给对这两种交叉技术有着深刻见解的人员。

现在开始创立人工智能优先公司还不算晚。无论你驾驶的是小船还是大船,科技的发展潮流都能帮助你迎头赶上。现有的方法可以高效地准备数据、让你用少量的数据做很多的事情、综合生成数据、有效地标注数据、自动构建机器学习模型,以及将它们与现有软件进行集成。我们将在这本书中学习其中的许多方法。