- 智能学习的未来
- (英)罗斯玛丽?卢金 栗浩洋
- 17333字
- 2021-03-28 21:11:21
1983年6月10日那天,我的第一个孩子出生了,我们叫他詹姆斯(James)。直至今日,我依然记得当凝视那个依偎在我怀里的小人儿时,自己心里是多么惊喜。在那一刻,我的情绪是如此强烈,几乎让人难以承受。这个小家伙的气味是那么好闻,皮肤是那么柔软,呼吸是那么轻柔。任何一位父母都会理解孩子出生时那种全身心浸润其中、汹涌如浪潮的父爱和母爱,而且这种爱将伴其一生。那天,我不仅体会到了初为人母的爱、欢乐和兴奋,而且体会到了巨大的责任感。我怀中这个完美健康的小人儿还没有能力照顾自己,他未来能否健康成长完全依赖于我。我有责任保护他的安全,有义务让他幸福快乐。他是社会的一分子,我有责任让他充分挖掘自己的潜力。
在我的世界里,孩子的出生和成长是最大的奇迹。地球上有飞流直下的瀑布、层峦叠嶂的山脉、碧波浩渺的湖泊和一望无际的海洋,但这些对我来说不及见证一个孩子出生和成长这个奇迹之万一。女高音歌唱家歌唱的纯美曲子、精致美味的餐食、新鲜出炉的面包、现磨咖啡以及和煦夏日香橙花所散发的香味,无一不让人心醉,但这些在我们所处的复杂世界乃至整个宇宙中都只不过是浩瀚海洋中的一滴水罢了。然而,我们相信,作为拥有智能的人类有能力理解整个世界的复杂性,理解其中的各种奇迹和经验,并通过解释传达给其他人。我们甚至还相信,我们可以通过某些标准化指标来测试、衡量这种智能。
我们正在削弱人类智能
在如今的时代,我们痴迷于衡量自己各方面的能力,希望以此获得一种“一切尽在掌控之中”的感觉。不仅如此,我们还痴迷于与别人相互衡量,用以比较谁表现得好、谁表现得不好,或者谁没有表现出他本应达到的良好程度。我切身体会到这些是在我儿子出生后的最初几天,医护人员告诉我他的体重、身高和头围。我定期带他到婴儿诊所称重,并将他的体重与同龄婴儿的正常体重范围进行比较。我们采取此类措施的理由很充分,因为我们希望确保婴儿拥有健康的饮食和良好的照顾。但是,我认为我们已经过分痴迷于量化生活的方方面面,尤其是智能这方面,而这种过分痴迷得不偿失。
对于如何衡量事物以及应接受哪些信息来理解某事物,我们也很容易遵照权威人士的意见。比如说,在判断某食品是否新鲜时,我们不再用眼睛看它是否变色,不再用鼻子闻它是否变味,而是看一个写着生产日期和保质期的标签。我们采用一系列标准化考试,并以孩子们在考试中的得分来判断他们是否跟上了学习进度。我们以人们在社交网络上的朋友数量来判断他们的受欢迎程度,甚至以此来判断他们的个体价值。
作为一名科学家,我喜欢证据,但我同样重视判断证据是否有效的能力。然而我担心,大多数人已经丧失了自我判断的能力,陷入了需要权威机构来帮忙判别真伪的怪圈。这些权威机构可能是食品标准局或某零售商,可能是认定某资质的机构,甚至可能是一家大型技术公司。我们很容易就盲目相信此类权威,而不是利用我们的智能来评价、辨别和了解事物。我也担心,我们在选择相信此类权威之前,没有做太多考量和质疑。我们之所以选择相信某些权威,可能是因为其他人相信,或者是因为我们所尊重的人告诉我们这些权威可信,抑或是因为历史或传统等诸多因素使它们成了权威。也许我们之所以相信它们,是因为我们熟悉它们,或者是因为我们能够理解它们所制定的指标。然而,我们很少考虑自己为何会将某人或某物视为权威。我并不是指我们需要质疑每个权威人士或权威机构,而是说需要知道自己相信某个权威的理由,以及知道在什么时候要寻找更多有效的证据和数据来判断此类权威的可信度。我还担心,我们对于测量的痴迷与对简单方便的追求,正在逐渐剥夺我们对于价值的思考能力和判断能力。更糟糕的是,在判断某些事物的价值时,它还导致我们有所偏颇。尤其是,它让我们过度简化和低估人类智能,并过度重视人工智能。
只需要回顾一下2008年的全球金融危机,我们就能看出,在判别某权威是否真实可信以及如何利用真实有效的证据来做出判断方面,我们的能力确实非常欠缺。当时,金融机构说服人们去投资次级抵押贷款债券。利率一开始很低,但它不断上升,很多次级抵押贷款市场的借款人最终无法按期偿还借款。大量自认为充分了解信息的投资人就因为相信发行此类债券的银行,认为它们属于权威机构,而盲目购入了这些毫无价值的债券。即便当时有少数人对这些债券中的优先抵押相关条款提出质疑和担忧,也没有人听他们的,因为他们不是公认的权威机构,所提出的质疑又是在暗示一种前所未有的状况。另外,他们的观点令人十分不安,人们宁肯选择掩耳盗铃。我认为,当时的这些情况证明,人们已经失去了对证据有效性做出明智判断的能力,哪怕不是完全失去,也是十之八九了。如今,我们再次面临类似的问题,因为人们太容易相信“假新闻”了。
什么是智能
我们有很多需要有效评估其价值的事物,考虑到本书的主题,我将范围缩小到了人类本身。本书将主要探讨我们试图用哪些方式来判断人们的能力、智力和智能。我们从小就开始接受此类考试,并且终身都将如此。我们不仅在个人之间进行比较,而且在各国之间进行比较,比较哪国学生在该国的中小学和高等教育中表现最好,由经济合作与发展组织(OECD)所统筹的国际学生评估项目(PISA)就是其中一个例子。本书将主要探讨智能,因为拥有智能是我们与其他动物最根本、最核心的区别。
本书的重点在于我们以何种方式来判断、衡量某人是否聪明、某物是否拥有智能,以及我们是如何不断量化此类智能的。我将深入研究如今的教育体系对我们认识、探讨和评估智能的方式所造成的影响。在当今世界,人工智能的发展日新月异,因此,我也将整个研究置于机器智能化的大环境之中。这本书从一个务实的角度,为读者解开人类智能的关键要素,意在指出人类智能是我们需要珍视的瑰宝。通过本书的阐述,我将提出一个中心论点,然后就此讨论我们该做出何种反应。我认为,我们用于识别、探讨和评估人类智能的方法是贫乏且不当的。由于缺乏合适的工具,我们正在使自己变得更加愚蠢,而不是更加聪明。然而,我们自己才是这个世界上最宝贵的资源。
更糟糕的是,由于欠缺评价人类智能的方式,我们严重高估了新兴科技所拥有的智能。这无异于本末倒置,我们因为无法对周遭世界中所存在的证据做出合理明智的判断,所以将人类的未来置于危险之中。25年来,我一直在研究和开发用于教育的人工智能系统,所以我说的话绝非危言耸听。当然,我完全支持在教育中使用设计合理的人工智能系统,我也坚信人工智能在帮助人类学习和教学方面具有不可估量的价值。正是由于人工智能在我们如今的生活和学习中无处不在,所以才引发我深思,我们究竟该如何看待人工智能。
在我进一步展开阐述之前,我需要明确本书中“智能”的具体含义。根据《牛津英语词典》(Oxford English Dictionary),智能是“理解的能力,或称智力”。作为名词,智能是一种在智力层面上的“理解能力”。如果我们再查找“理解”的词义,就会发现,“理解”作为名词的定义是“知识”,作为动词的定义则是“领悟的能力,了解事物含义或意义的能力,或提炼事物概念的能力”。如果我们“理解”某事物,那就意味着我们“熟悉”该事物,并且是“通过经验熟悉该事物”。
以上种种解释看上去都有道理。但是,这些定义并没有指明我们到底应该如何评估一个人或者其他事物所拥有的智能。
事实上,在此类定义下,智能像是在某个节点上我们或拥有或没有的东西。当我们试图理解智能这类复杂概念时,借助于字典往往不是最佳选择。很明显,人类智能与以下这些密不可分:智力、诸多复杂的认知过程,以及我们对他人与自己所拥有的知识和技能的理解。正是由于拥有智能,我们才能够学习、运用所学的知识,通过综合考虑我们所掌握的信息来解决问题、与他人沟通、做出决定、进行思考、做出表达,以及从经验中吸取教训。这些肯定比我们在学校学到的书本知识要多得多。
几十年来,对于智能意味着什么以及我们如何评估智能,人们的观点已经发生了很大的变化。例如,著名的“苏格拉底悖论”(Socratic Paradox)可以追溯到柏拉图,并体现在“我知道一件事,那就是我什么都不知道”这句话中;有人说,爱因斯坦认为智能与想象力是密不可分的;哈佛大学早期的招生导师则认为,一个人使用多种语言的能力就是其智能的体现,这些语言包括拉丁语、希伯来语和希腊语。近些年来,随着我们不断试图量化和衡量智能,我们已经设计出了大大小小的测试,人们可以通过参与此类测试并获取分数来评估自己的智能水平。
在20世纪初,为了确定哪些孩子可能需要接受特殊教育,法国心理学家阿尔弗雷德·比奈(Alfred Binet)和助手西奥多·西蒙(Theodore Simon)设计了比奈-西蒙智力量表(Simon-Binet test)。智商的概念从此诞生了。该智力量表认为每个人都拥有特定的智商水平,并据此专门设计了一系列标准化测试来评估人类的智能,以被试在该测试中获得的总分数除以被试的年龄,所得结果就是被试的智商。此类智力测试的支持者们也承认,因为智能的概念本来就很抽象,所以测试的结果只是一个估值。多年来,智能测试结果被用于衡量某些特定的个体,确定哪种教育系统最适合他们、他们是否适合某项工作,以及他们是否有明显的智力残疾。
随后,人们又设计出更多形式的智力量表。例如,1939年的韦克斯勒量表(Wechsler Scales),其中包含了非语言项目;1969年的贝利婴儿发展量表(Bayley Scales of Infant Development),用于两岁以下儿童的发展评估;以及1979年的英国能力量表(British Ability Scales)。究竟什么是智能,如何评估智能,这些依然没有定论,新兴的人工智能机器及其大规模应用再次引发了人们对智能评估的研究兴趣。智能与教育息息相关,两者之间的联系也正在引发人们的进一步思考。随着人工智能在工作场合之中发挥的作用越来越大,人们也日益关注应如何在教育、培训和评估等领域做出相应改变以适应这种变化。
在接下来的两章中,我将详细介绍和智能相关的具体细节,我将从《牛津英语词典》所给出的定义出发,进一步探讨知识、理解和通过经验获得的熟悉度等相关核心概念。在本章接下来的部分,我想通过介绍本书中的一些关键论证因素来激发你的阅读兴趣,其中包括:智能的社会基础和人类发展的重要性、人类本能和运气的作用,以及真实有效的证据的价值。
智商只代表智能的很小部分
智商值是对某个人在特定时刻所具有的智力的评估,但智能不是静态的,它会随着时间的推移而不断发展。正是由于智能的发展,1983年那天出生的小婴儿才得以成长为现在能够对自己的孩子负责的成年人。由于智力测试得分是将被试所获总分除以被试的实际年龄,因而个体随时间推移所取得的智能发展很难通过智力测试得分来体现。个体在发育阶段时,实际年龄并不是能够准确判断其智力的决定性因素。如果是的话,那么所有的孩子都会以完全相同的速度发育,但我们都知道,事实绝非如此,儿童之间存在许多个体差异,这意味着,在发育阶段,实际年龄并非是能够做出合理判断的决定性因素。
人类智能是如此复杂,而智力测试又是如此片面单一,我认为两者之间很难等同起来。我承认,确实有大量证据表明,智商得分与死亡率、学业成绩、言语流利程度等因素之间具有一定的相关性。即便如此,我依然认为智力测试无论是其本身,还是以一种静态的方式评估某人在某一特定时刻所拥有的智力的做法,都存在着严重的不足,因为智能具有非常明显的发展特征。只要我们没有患上痴呆症或其他心理障碍,智能就可以在我们整个生命中不断发展。因此,我们需要从这种不断发展的角度来思考智能。智能永远都是一个半成品,因为它始终处于不断发展和进化之中。
由于不满智力测试的不足,苏联心理学家利维·维果茨基(Lev Vygotsky)另辟蹊径,试图找到一种将人类智能发展特征考虑其中的更加合理的描述方式,尤其是针对学龄期的青少年。维果茨基认为,儿童的发展是他们与其他人进行人际互动的结果。此类人际互动过程是儿童得以不断构建其心理机能的基石,儿童的智能也因此得到相应的发展。
维果茨基所提出的理论通常被称为“文化发展法则”(law of cultural development),法则认为,每个个体的智能都是个体所处社会环境的产物。这也就意味着,社会对于其成员的智能发展有着不可推卸的责任。能够创造丰富的人际互动机会,从而使其成员的智能得到充分发展的社会,将拥有强大的群体智能。这个文化发展法则同样能够解释当儿子出生时我所感到的强烈的责任感,也证实了这种责任感的合理性。
在1978年、1986年与1987年发表的维果茨基的相关研究,更确切地说是他以俄文撰写的研究论文的英文翻译版,在近些年来受到了相当多的批评质疑,例如2015年亚斯尼斯基(Yasnitsky)和范德维(van der Veer)等的论文。此类批评的出现主要是因为维果茨基著作的英语译文质量很差,和原著有诸多出入,存在很多误译。即便如此,我依然在阅读这些著作的英文版中收获良多。同一时期的行为主义心理学家倡导的是外在表现,这在当时十分流行,例如桑代克(Thorndike)在1911年和1914年的研究、沃森(Watson)于1926年的研究,以及斯金纳(Skinner)在1991年和1957年的研究,但相较而言,我更偏向于认同维果茨基对人际互动所给出的高度评价。还有一些其他备受推崇的学者所做的研究,我也同样信服。例如,杰尔姆·布鲁纳(Jerome Bruner)于1996年发表的研究指出,维果茨基在其理论中强调了社会意识对个人认知的重要影响,他认为这一理论非常重要。他认为,维果茨基的研究是具有革命性意义的,它让人们认识到社会意识应被视为集体主义和个人意识的融合。此外,在过去几十年中,我也针对相关主题进行了深入的科学研究,大量证据让我认识到维果茨基的观点的正确性,同时我也必须在此声明,确切地说,这里我所提及的维果茨基的研究成果指的是他原著的英译版或者编译版。换言之,对于维果茨基的研究成果,我始终持以科学思辨的态度。
维果茨基在关于人类智力和意识的研究中引入了发展的研究方式,他认为,人类基本的心理机能,例如非自主性记忆,构成了人类行为的基础,并且是进化发展的结果。此类低级心理机能是动物和人类所共有的。而高级心理机能,如创造性的想象力和理性思考,则是人类特有的,不能用与基本的非自主性心理机能类似的方式来解释。两者最关键的差异在于,人类所进行的思考是社会互动和人际互动的产物。我将这些高级心理机能称为“高级人类思维”,而这种高级人类思维正是我们人类智能的基础。
高级人类思维是通过人类彼此沟通、协同合作而不断发展起来的。我们使用工具来完成各种任务,例如烤蛋糕、砌墙或者写书等,与此类似,我们将手势、口头语言以及书面语言作为工具,以此进行沟通和管理,展开协同合作。正是由于如语言这样的交流体系、符号体系的不断发展,人类才得以以抽象的思维模式来思考我们与世界的具象互动。我们能够思考和谈论自己没有亲身经历的事情。我们拥有抽象思维模式。
当接受真实世界、社会环境中的各种刺激时,我们会对这些刺激做出反应,而诸如语言一类的符号体系则为这个过程架起了桥梁。此类符号体系是我们高级人类思维机能的基石。语言的出现对维果茨基而言意义重大,其分量之重犹如有组织的社会劳动力的出现对于马克思和恩格斯的意义。正如文化发展法则所表达的那样,对人类智能的起源所展开的任何研究,都应重点考虑到个体所进行的人际互动与社会历史根源,而不应将重点放在某个个体的心理机能、生理成熟状态或基因遗传上。如果我们从社会人际交往这个角度来考虑和评估人类的高级思维和智能,那就会发现,智力测试完全没有抓住重点。我并不是说智力测试没有任何用处,我只是说,智力测试的结果只能代表人类智能的很小一部分,这部分仅仅是人类智能中需要用于完成智力测试所需的特定思维方式的那部分。
我将在第4章中详细探讨群体智能。现在我想讨论的问题是,人际互动的过程是如何形成人类的思维的。维果茨基将我们的社交活动与心理机能之间的联系称为“内化”。内化是一个极其复杂的过程,通过内化,我们不断习得和掌握用于像语言这样的社交活动的符号体系。当我们掌握此类外在符号时,它们能够转化为我们思维的符号,这个过程可以称为“心理的符号化”过程。内化的过程意味着,我们所处的不同文化环境将导致我们用在不同文化中浸润的思维方式去参与社会互动。我们在不同的社交活动中所使用的不同语言,不仅影响了我们用于思考的内在语言,而且使我们能够理清自己的思维,并将我们的思想和语言传递给后代。如果没有社会互动中语言的存在,那历史也将无迹可寻。
在之前关于智力测试及其得分的讨论中,我强调,所有关于智能的标准都需要以发展的眼光来看。维果茨基的理论正是从发展的角度来看待智能的,他认为,个体心理机能的发展取决于个体与其社会文化环境之间的互动。社会环境的性质会影响和塑造其中个体心理机能的特性。这种内化过程的理论结晶就是维果茨基最著名的理论:“最近发展区”(zone of proximal development,ZPD)。最近发展区是针对学龄儿童的概念,因为人们认为,教学对于学龄儿童的知识技能增长效果特别明显,而最近发展区对于教学至关重要。值得注意的是,有研究人员发现最近发展区中的关键过程在学龄前儿童的认知发展和成年人的认识发展中均有出现。最近发展区描述了同一种文化环境中个体之间丰富的互动,例如,作为教育机构中的一部分与作为学生时不同的互动。这些多层次的互动会成为影响单个学生的发展和智能开发的最重要因素。在本书的第6章中,我将探讨教育应如何改革才能更好地为人类智能的未来做好准备,届时,我还将回归这个主题。
现在,我想将重点放在思维、意识和智能的社会基础上,以及为何我深受维果茨基理论的影响。我认为,从根本上来说,一个人的智能是与其社会互动能力紧密相连的。智能不仅源于人际互动,而且也越来越多地体现在人际互动之中。我在这里所说的人类智能指的是一个宏观的概念,而不是狭隘的掌握特定知识或使我们在智力测试中获得高分的技能。我将在下一章中深入阐述宏观意义上的人类智能概念究竟指的是什么,但现在,我主要想强调,在现代的智能概念中,社会互动依然应被视为基石。我们若想要在21世纪不断取得发展和进步,就需要充分利用这种智能。这是一种人类所独有的智能,它源于我们对自己和同伴的情感,源于我们的感官,源于我们对自己和同伴的深入理解。这种智能是人类的核心,它对我们未来的福祉至关重要。
智能取决于本能
人们通常认为,人的本能是与生俱来的理性行为,但实际上,人的本能是无意识行为。此类先天性行为并非源自习得,用维果茨基的话来说,它们是没有中间媒介的行为。它们是生物体对刺激的直接反应。然而,这并不是说,它们就完全独立于与人类智能相关的由高级人类思维所引发的复杂行为。换句话说,我们的本能和智能之间存在着一定的联系。
为了进一步探讨和解释人类本能和人类智能之间的联系,我将引入一个近年来在人类心理学领域十分流行的讨论方式,这种方式之所以能够推广,主要得益于来自普林斯顿大学的诺贝尔奖得主、经济学家丹尼尔·卡尼曼(Daniel Kahneman)的研究成果。在之前的研究中,基思·斯坦诺维奇(Keith Stanovich)等心理学家引入了一个概念,即人的大脑存在两套系统:“系统1”和“系统2”,卡尼曼在此基础上进行了扩展。他们认为,系统1是自动的,不在我们的意识控制范围之内,这一系统可能就是我们所说的人类的本能。系统2则是有意识的,需要耗费大量脑力,这一系统则是人类所独有的复杂思维的产物,在我们的意识控制范围之内。因此,我们通常会将系统2与人类智能联系在一起。在此,我并不是要强调,我们的大脑用两种不同的系统来思考问题,而是想说,通过引入“我们的思维其实包含两个相互关联但又互不相同的系统”这种观点来思考问题会非常有效。
在我看来,这种观点的关键之处在于,系统2的智能取决于系统1的本能。换句话说,如果没有系统1的本能,也就不存在我们无比珍视的智能。系统1是我们感知周围世界、认识物体、躲避灾害和痛苦、识别与我们谈话之人是否处于愤怒状态等能力的基础。然而,系统1并非只能对刺激做出无意识反应,它还能通过不断累积对外部刺激所做出的反应来建立联系,加快思考速度,包括快速浏览简单文本、骑自行车等技能。系统1主导的行为通常不怎么费脑力,而且似乎属于自主发生的行为。但实际上,在多数情况下,它们是由积累形成的反应。
每个个体在系统1中所拥有的技能都不尽相同,因为系统1的一部分能力来自在某个专业领域的不断实践所积累的技能,例如高级驾驶技能,或在国际象棋对弈中,凭直觉就判断出某步棋是一步出奇制胜的好棋的能力。系统1主导的行为包括自主发生的行为,也包括我们可以控制但通常不会主动去控制的行为。每个汽车司机都经历过,当他们抵达目的地的那一刻才意识到,他们这一路上并非时时刻刻都在专注于开车。在某些时候,他们似乎进入一种“自动驾驶”的状态。这就是经过不断的专业训练,累积在系统1中的直觉技能。
相较于系统1,系统2需要我们集中注意力。无论是驾驶新手无一不害怕的侧方位停车,还是我提笔撰写本书中的一字一句,这些行为都需要个体全神贯注,一旦分散了注意力,那由系统2主导的行为就会立即停止。我们也可以使用系统2的思维来刻意控制系统1的思维,例如通过干预系统1正常的自主运行来将我们的思维集中在特定的活动上,包括在最后的时限内规划出一条复杂的路线、学习很难的微积分元素,或者研究莎士比亚戏剧中李尔王与他3个女儿的关系之间有何细微差别。
当我们刻意控制自己的思维,有意识地将注意力集中于某一项活动时,完全有可能错过在我们周围所发生的事情。当我们看着火车站的发车时刻表时,根本不会注意到那个拖着拉杆包的男人正要伸手打我们;当我们听老师讲微积分时,根本不会注意到教室窗外发生的车祸;或者在伦敦的环球剧场观看《李尔王》的演出时,根本不会注意到演出过程中下起了雨。即使事后我们得知了这些事情,也无法相信事发当时我们没有注意到:那个拖着拉杆包的男人不知道从哪儿就突然冒出来了;窗外的车祸不知道怎么一下子就发生了;演出中途下雨了吗?正如丹尼尔·卡尼曼所言:“我们不仅会对显而易见的事物视而不见,而且会对这种视而不见一无所知。”
我在此介绍系统1和系统2的相关性,主要是为了强调这两个系统是相互关联的。系统1就像精力充沛的孩子,总想取得系统2的关注、对其行为做出反应。系统2大多数时候都像“懒散的”父母,因为在大多数情况下,一切照常进行。因此,系统2通常会接受系统1的建议,系统1的印象、感觉、直觉等就会转化成系统2有意识的想法和自主性行为。系统1只包含了大脑已经习得的能够自动处理的技能,而在一些情况下,我们所要处理的问题已经超出了系统1能完成的范畴,因此我们要启用系统2来处理问题。只有当需要系统2以更加专注的方式处理问题时,我们才会意识到系统1的存在。
系统2还控制着我们对自己的认知、我们调整思维的方式,以及对人类发展自我效能感而言最重要的元认知的知识和技能。自我效能感对于人类智能至关重要,我将在本书后续章节中详细讨论。
系统1和系统2之间的关系也并非总是和谐的。系统1总是精力充沛,时刻保持活跃状态,常常会自动产生许多难以避免的行为,这样就会给我们带来一些问题。这种倾向通常意味着我们的行为会具有偏向性,而我们自己甚至无法意识到这一点。举个例子,多年来我一直意识到,我特别容易听信某一特定类型的人。这类人总是积极向上、朝气蓬勃,总能谈些生动有趣的见闻,又有着丰富多彩的生活经历。当这类人向我提出什么建议时,即便我认为他们的建议不是特别合适,我也总是会倾向于听从他们。如果是一个安静、稍温和的人向我提建议,我通常需要找出更多的证据来证明他的建议是否合理。我知道自己有这种偏向性,但我仍然无法自控地受到这类人的吸引。对于这种状况,我认识得越清楚,就越能够更好地控制自己想要盲从此类朋友的念头。然而,想要很好地控制偏向性着实不易,这不仅需要耗费大量精力,而且也不是次次都能做到。
在上述例子中,我总是偏向于听从某一特定类型的人,这种偏向性毫无益处,此时我就会希望大脑中的系统2能够不那么懒惰,能更好地控制精力充沛的系统1。然而,在紧急情况下,比如当我在火车站专心致志地看发车时刻表,一个拖着拉杆包、手里端着一杯热咖啡的人想要打我时,我大脑的系统1就会立马做出反应,让我离开,减少我受到伤害的可能性。在这种情况下,系统1的自发行为就是必要的。
关于这两个系统,我还想讲最后一点。这一点涉及斯坦诺维奇和理查德·韦斯特(Richard West)的最新研究,正是他们率先定义了大脑的两套工作系统。他们最新的研究重点是试图解释为什么有些人更容易产生偏向性。他们认为,系统2实际上由两个独立的子系统组成。子系统1所处理的任务是复杂计算、刻意的慢思考以及完成智力测试等,他们将其称为“算法子系统”(algorithmic subsystem)。这个子系统能够从一个任务快速切换到另一个任务,并且效率非常高。在智力测试中,如果被试的大脑系统2中的子系统1发展得很好的话,他们的得分通常就会很高。
然而,仅仅这样是不够的。系统2中还有另外一个子系统,这个子系统使我们忽略自己的偏向性,并在一定程度上控制如同一个精力充沛、时刻寻求关注的幼儿的系统1。这就意味着,当我们的本能受到吸引,想要采取某种行为时,我们并不是没有动用系统2,恰恰相反,我们的系统2耗费了一些脑力,允许了我们接受系统1的本能。系统2的第二个子系统让我们时刻保持注意力,使我们能够集中精神、自我控制,即便在疲倦的状态下也依然如此。这个子系统让我们能够对抗系统2的惰性。斯坦诺维奇称系统2中的第二个子系统为“理性子系统”(rational subsystem)。研究表明,具有较强理性子系统的人能够更好地应对认知负荷,避免过度自我损耗。如果大脑需要集中精神处理问题,从而大量消耗脑力,就会削弱我们的自控能力,这时候就会发生自我损耗。有证据表明,传统智力测试只能测量人们的算法子系统,但相较而言,理性子系统才能更准确地衡量个体的智能水平。
对于系统2中至关重要的第二个子系统,“理性”一词给人感觉太过普通了。实际上,一个更复杂的名字可能才更加合适,因为该子系统还包含了爱因斯坦非常重视的想象力以及我们产生自我认知的关键成分。我们需要找到一个更合适的词,来表达该子系统的存在使我们能够在清楚自己知道什么,也清楚自己不知道什么的情况下,用一种以准确目标为导向的有效方式来采取行动;它还使得我们能够合理解读始终处于活跃状态的系统1不断给出的建议和情绪等信息。我们需要找到一个更合适的词,来表达我们同样可以控制和调节自己的反应。我认为“自我效能感”可能比“理性”更加合适。
我将在接下来的两章中详细探讨智能,并将这个“理性”子系统与自我效能的概念联系起来。我在探讨自我效能感的概念时,会将其作为一种元认知的知识、技能和调节的混合体,并且它还带有某种特定动机。在这种情况下,系统2的算法子系统将提供准确的基于证据的元认知的知识和技能,而系统2的理性子系统则将提供元认知的调节和以特定目标为导向的动机。这两个子系统都是人类智能的基石,但是目前我们过度重视算法子系统,而没有同样重视理性子系统。我还将进一步探讨系统1自动思考的重要性以及我们对整个世界的感官体验,这些都是人类智能的一部分,而我们并未给予其应有的肯定。
运气对人类智能十分重要
那么运气呢,又作何解?你是在这样问吗?没错,我之前说了我将会探讨人类的本能和运气。运气就像经典芝士酱中的那一小撮辣椒粉或者最受欢迎的番茄意面酱中的那一小撮糖:它们犹如神来之笔,在我们对于整个世界的体验中起着画龙点睛的作用。运气无法由我们自己来掌控,因此我们不想承认运气在生活中的重要作用。有些人说,“你的运气你做主”,但当我看着世界上最贫穷地区的儿童们食不果腹,根本没有机会享受良好教育所带来的机遇和前途时,我就深深感到上面那句话的空洞无力,很显然,幸运之神没有眷顾这些儿童,而且他们也根本无法改变自己的现状。
我们希望将自己视为理性、智慧的人类,能够掌控自己命运的人类。我们不愿意去承认,运气其实在我们的成功中也起着至关重要的作用。因此,对于发生在自己身上以及其他人身上的事情,我们倾向于在事后进行合理化解释,这样一来,我们就无须承认运气在这些事情中所起到的作用了。
在我的早期学术生涯中,我认识到了好的表述所具有的力量。博士毕业后,我的第一份工作是一名研究员,当时,我参与的项目的研究目的是探索叙事在构建我们理解世界的方式时所起到的作用。正是这种叙事的力量导致了我们在事情发生之后做出合理化解释,从而大幅夸大了人类的能力。我们用这种表述来解释事情发生的原因、某人成功的原因,以及我们在考试中获得优异成绩或赢得一场桥牌比赛的原因。我们之所以这样做,是因为一旦我们将一部分成功因素归因于运气,就会破坏我们良好的自我感觉和自我评价,就会认识到自己感知力和智能的不足。然而,幸运女神带给我们的未知运气才是画龙点睛之笔。我们需要找到一种方式去承认,运气在智能的整个概念中同样起了十分重要的作用。
证据是智能的关键特征
关于智能的最后一个关键特征——证据,我想探讨的是:证据具有哪些性质,何种证据才是真实有效的,以及当我们调整自己的做法和行为时,应该考虑哪些证据?我在此讨论的证据指的是广义上的证据,是我们在整个世界中的观察和体验。正是这种基于知识和理解的证据,使我们能够以自我效能的方式去思考,成为拥有智能的人。此类证据是智能的重要特征之一。
作为一名科研人员,我需要快速识别哪些证据是真实有效的。这不仅需要我设计出合理的方式去收集数据,而且要从专业的角度去分析数据,并且能够从分析中得出关键结论。同时,我还需要整合多个来源的数据及其结果,并对其进行分析,得出结论,从而进一步推动自己的研究。不仅如此,对于同行和同事在他们的论文和书籍中所描述的研究和所呈现的证据,我也需要对其合理性和有效性做出判断。
就个人而言,我对一类证据特别感兴趣,这些证据能够证明某项科技是否有效,以及如果有效的话,又是如何产生效果的。尤其是当这项科技涉及人工智能,并且是用于教育领域时,我会格外热衷于找到相关证据去证明该项科技是否能够帮助学生更好地进行学习,帮助老师更好地开展教学。作为一名涉足教育应用技术的开发人员,常常会有人要求我们展示某项技术是“有效的”。因此,我花了很长时间和大量精力去研究,当我们说一项技术“有效”时究竟意味着什么,我们到底需要该项技术来做什么。我还与一些教育应用开发人员合作,尤其是那些已经成立了小型开发公司的企业家或是在此类公司任职的员工,我的主要任务就是帮助他们了解哪些证据能最好地证明他们的技术“是否有效”以及“效果如何”。
经过多年的专业训练,我已经能够快速、准确地识别哪些证据才是真实有效的。如果没有这个技能,我肯定无法再在这个领域继续下去。我也逐渐意识到,这项技能是多年以来不断练习和学习的结果。最近,我的同事穆特卢·库洛瓦(Mutlu Cukurova)博士和我正在设计一个培训课程,帮助参与课程的企业家去理解研究型证据。该培训课程的初衷是教会这些企业家解读研究报告中的结论、设计出合理的方案去收集和分析数据,从而帮助他们了解自己的产品或服务对于目标受众,即学生和老师是否有效。在此,我必须声明,穆特卢着实是一位非常有才华的学者,整个课程设计都是他在挑大梁,他所设计的培训课程优秀极了。
当第一批企业家满怀热情地加入培训课程时,我们很快就意识到,虽然这些人智能水平颇高,但他们一直以来都专注于企业经营,因此对他们而言,这个课程还是太复杂了。我们需要提取课程的精髓,如爱因斯坦所说的,“删繁就简,要义不减”。以此为方针,穆特卢重写了整个课程。
改进之后的课程使第二批企业家受益颇丰。整个课程的学习对他们而言是一种挑战,但他们乐在其中,也从中学到了很多。我一直认为,如果人们能够在经过点拨后认识到何种证据才是真实有效的,了解到如何重新审视和判断根植于他们脑中的信念并理解自己是如何受信念影响进而采取行动的,他们必将受益匪浅,而这个课程无疑证实了我的观点。我一直担心,如果人们未能接受良好的培训,没有获得识别真实有效证据的能力,就很难在真伪之间做出合理的判断。如今,社交媒体肆意操纵着人们的观点和意见,此类事情屡见不鲜,也证实了我的担心并非多余。社交媒体的回音室效应、虚假新闻报道和伪专家的泛滥,都让事态更加严峻。如果人们不知道如何有效区分真实和虚假,不知道哪些只是意见,需要他们从证据中得出结论,从而形成自己的意见,那么他们轻易就被互联网大量真伪难辨的信息所欺骗也就不足为奇了。在此,我并非建议每个人在社交媒体上看到一条新闻报道时都去做一次全面的文献综述,而是建议每个人都应培养自己辨别真伪的技能和知识,学会用批判的思维方式来处理这些新闻报道,并应知道当我们需要找寻可靠证据时,要如何搜索以及在何处搜索。
下一章中,我会讲到我们很容易混淆信息和知识。信息是需要我们去分析和整合的数据,我们需要从这些数据中抽取关键内容,从而构建知识和理解。在此,我想谈谈提问的重要性,因为正是这些问题推动我们做出判断,确定究竟哪些才是真实有效的证据。
库洛瓦和我一直认为,想要帮助企业家理解研究型证据,最重要的一点就是教会他们如何提问。如果企业家知道如何提问,那就不仅意味着他能够理解相关研究的现有出版物和报告,而且意味着他能够知道如何进行数据收集和分析,并了解要收集和分析哪些数据才能准确知道一项技术“是否有效”以及是“如何生效”的。作为一名科研人员,我深知,在开始考虑可能需要收集哪些数据或者想从现有研究中收集哪些证据之前,我必须花大量时间想清楚自己究竟想从证据之中获得什么问题的答案。当我们发现企业家们未曾认识到这第一步的重要性时,并没有惊讶。如今,我们身处大数据时代,海量信息唾手可得,很容易就让人忘记了应该在查找数据之前想清楚究竟想要什么问题的答案。
为了帮助参与课程的企业家提对问题,从而进一步推动他们的研究设计,我们首先做的就是帮助他们认清楚一个好想法和一个研究型问题之间的区别。他们研发的技术通常是用来解决某种有问题的状况的,我们就通过询问他们这些问题具有何种性质来拓宽他们的思路。我们指出,针对同一种有问题的状况,可以提出不同类型的问题。例如,我可能认为存在着某个问题,并想做更深入的了解,在这种情况下,我会提出探索性问题;或者,我可能想找出解决这个问题的办法,这时就会提出针对性问题和方案,并判断自己给出的解决方案是否可行;抑或,我可能想从根源上改变有问题的状况,从而观察这样是否能解决问题。我们鼓励参与课程的企业家去探究,对于他们的企业和技术,什么问题才是对的问题、问题对在何处、该问题为何与客户相关,以及能否通过严格管理来控制潜在偏向性和主观性。我们让他们确保自己不会在不知情的情况下做出假设,同时还让他们关注自己在研究型问题中的措辞,他们需要确保问题的表述清晰明确。
为了帮助参与课程的企业家更高效地学习,我们引入了“变化理论”的概念。变化理论指的是,在特定背景下,对预期变化的发生方式和原因的综合描述。我们向企业家们介绍变化理论概念的逻辑模型,让他们利用该模型来展现自己在公司业务中所做的干预措施和行动。通过该逻辑模型,干预措施与其结果和后续影响之间的关系一目了然,他们公司的技术能否带来他们所期待的结果也就非常清楚了。我们之所以要让企业家们创建这个逻辑模型,目的是帮助他们将他们正在采取的措施与想要的结果联系起来。对于产品或服务所能获得的主要效果,企业家们往往很难衡量,也不知道究竟是哪些措施产生了这些效果。
企业家们如果想要通过研究来解决问题,就必须先设计出问题的框架,而上述逻辑建模的过程正好能够为他们的设计打下基础。在这个阶段,我们的任务还涉及一个颇有争议的主题,即我们对知识的本质和范围、对自己如何了解世界所持有的信念,通常这种信念被称为“认识论”。很多关于认识论的书均出自博学的学者之手,比起我来,他们能够更好地解释这个复杂的概念,例如霍弗(Hofer)和宾特里奇(Pintrich)于2002年出版的著作。然而在这里,我将把重点放在介绍认识论的关键要素上,以证明在构建人类智能的概念时,我们必须并且能够将认识论纳入其中。关于这一点,我们在参与课程的企业家身上得到了验证。因为如果他们想知道企业的技术“是否有效”以及“如何生效”的话,他们就必须了解自己所选择的收集证据的方法,而他们内在的认识论将深刻影响他们的选择方式。
我们认为知识是什么,我们又是如何认为自己已经掌握了某方面知识的?认识论对于这两点的认知至关重要。本书将多次探讨个人知识这个主题,而且在下一章中,我将深入探讨个人认识论的概念及其对我们学习方式的影响。本书均是从广义上对认识论进行探讨的,即我们对知识的本质和范围、对自己是如何了解世界的认识。对企业家而言,认识到他们选择证据的方式将受其认识论的影响是至关重要的。
关于我们如何了解世界这个话题,有两个极端的立场,这两者之间又有各种相对中立的立场。极端立场之一是实证主义者所持的立场。实证主义者认为,世间万物均有真相,只要我们能够找到真相,就能解释现实中的一切。这种立场非常灵活,而且参与课程的许多企业家刚开始都持有这种立场和信念。他们刚开始最感兴趣的通常都是试验研究设计,经常会涉及随机对照试验和定量数据分析等方法。他们认为,此类方法能证明,他们的特定技术产品或服务能够对其用户产生积极、重大的影响。而我们的目标就是,让他们拓宽思路,接受其他收集证据的方法。
在实证主义者的对立一端则是经验主义者,他们认为,我们对世界的认识和认识方式实际上均受到人类经验的影响。经验主义者的观点是,理论永远无法得到充分证明,并且除了随机对照试验,还有很多其他收集和分析数据的方法,这些方法均有其价值,尤其是当需要进行大型试验,而被试数量和资源又比较有限时,其他方法就有了用武之地。我们在课程之中向企业家们灌输了此类理念,让他们认识到他们采取措施时存在很多主观因素,他们需要对其进行管控,同时让他们认识到他们采取各种方法时需要保持一致性。最后,我们还需确保他们能够验证他们设计的研究。
还有一个方法可以用来检验证据是否真实有效,那就是检验其研究的普遍性。参与课程的企业家所开展的试验很少能邀请到大量被试,而且持续时间大多比较短,这意味着他们的试验通常来说普遍性不高。因此,我们需要让他们认识到研究结果可转移性的重要性,并让他们学会通过将自己的研究方法应用于不同的试验环境来判断其研究设计是否严谨。为了达成上述目标,他们就需要确定原始试验环境和后续对照试验环境之间是否有足够多的相似因素,从而判断试验结果是否具有可转移性。
我们培训课程的明确目标是,帮助参与课程的企业家收集有效证据,从而进一步帮助他们改善其产品或服务的设计,并使他们能够更好地向投资者和客户展示其产品或服务所能达到的效果。然而,我们开设此培训课程还有另外一个重要原因,那就是我们希望企业家能通过课程的学习,学会有效地利用前人研究中存在的证据。这意味着,我们需要教会他们确认什么样的证据才是真实有效的。我们希望通过教学来帮助他们认识到,针对他们采取的特定干预措施,需要如何进行有效的数据收集和分析。同时,对于他们能够接触到的现存证据,我们还帮助他们学会判断此类证据的有效性和价值。我们希望,他们能够将在设计自己的研究时所持的质疑心态用于阅读相关研究报告和论文中。通过运用从我们的培训课程中习得的知识和技能,他们将可以选择最合适的证据,并且在开展教育类技术研发时,能够利用证据更加明智地做出决策。
本章小结
在本章结束之前,我必须回到章标题——“重新认识智能”。我在前面讲到了自己对于人们低估人类智能的担忧。之所以会出现这种低估,是因为我们认为,人类智能及其根植于社会互动中的状态都是理所当然的。关于理解事物的能力究竟意味着什么,我们也未曾深究;而认清理解的本质,对于帮助我们做出明智的判断,分清在什么时候可以笃定、在什么时候又应该怀疑都是至关重要的。那么,这一切与人工智能又有什么关系呢?事实上,关系非常密切。如之前所述,我们用于识别、探讨和评估人类智能的方法是非常贫乏的。由于缺乏相应的方法,所以我们严重低估了人类智能,同时高估了机器的行为能力。而且,我们还将机器的能力也称为智能——人工智能。通过这一章的描述,我想请你好好思考一下人工智能中的智能究竟意味着什么,尤其请你仔细思考一下人工智能的能力,从而进一步解释机器究竟知道什么、相信什么。
在第2章和第3章中,我将深入解读关于人类智能的各个重要要素。通过解读,我希望你能认识到,人类智能是一项了不起的壮举,它广博丰富而又精妙复杂。我将带你认识到,智能远远不止我们在学校学习各科知识的能力、记忆的能力、解决复杂数学问题的能力、拍摄精彩照片的能力,或者撰写精彩文章、电影剧本、诗歌的能力。智能是社会性的、带有情感的、主观的,它并不总是可预测,但它是思考的基础。我将证明,对于人类智能,自我意识和自我效能感是至关重要的,而这两者在人工智能体系中尚不存在。
在第3章中,我将进一步探讨,我们在发展自我认知以及对世界的认知时,智能的影响和作用。我将探讨,我们如何发展认知的能力,又是如何知晓自己拥有认知能力的,即元认知。我将详细阐述人际互动和社交智能,这两者正是人类智能行为中最被低估的部分。同时,我还将解释我们对周遭世界的主观体验和身体体验的重要性,因为这些体验是我们得以了解世界、了解自己的基础。
第4章整合了我在第2章和第3章中阐述的所有智能要素。我将引入交织型智能的概念,以此来进一步思考和探讨智能。交织型智能由7个不同的要素组成。之所以使用“要素”一词,是因为该词意味着这些内容是至关重要、不可或缺的。
在第5章中,关于对人工智能的理解,我将探讨更广泛、更丰富的含义,即我们可以而且必须通过调动和评估更加复杂的人类智能来与人工智能联系起来。在第6章中,我将探讨利用人工智能来帮助人类提升人类智能的含义。如果我们的教育体系找对了方向,那就可以利用人工智能来帮助我们实现人类智能的发展。我将把重点放在学习上,并将强调一点:如今正是不断学习才使人工智能成了人类的威胁。我们必须牢牢记住,人工智能无时无刻都在不断学习,它们永不厌倦,这就意味着它们总是在不断改进。因此,我们也必须不断学习。只有不断学习,才能筑就成功和智能的基石。如果我们善于学习,世界就将任我们驰骋,人类也将不断取得进步。
在最后一章中,我回顾了前面6章提出的论据,并对主要论点进行了汇总。总而言之,我们用于识别、探讨和评估人类智能的方法和工具是极其贫乏的。由于缺乏此类方法和工具,我们正在削弱人类智能,而非增强人类智能,但对我们而言,人类智能恰恰是这个世界上最宝贵的资源。本书介绍了几种合理看待人类智能的方式,主要是通过交织型智能的七大元素来实现的。其中,我特别强调了“认识的认知”(epistemic cognition)和自我效能感。在本书开篇,我谈到我们痴迷于测量,逐渐变得无法通过一系列证据来做出正确的判断,而培养认识的认知正好可以反映这一点。与此同时,培养对自我效能的感知能力对于发展人类智能至关重要,如果想要测量人类心智,那么自我效能感就是关键数据。
给学习者的启示
1.由于欠缺评价人类智能的方式,我们严重高估了新兴科技所拥有的智能,这无异于本末倒置。
2.智力测试的结果只能代表人类智能的很小一部分,这部分仅仅是人类智能中需要用于完成智力测试所需的特定思维方式的那部分。