- 代数大脑:揭秘智能背后的逻辑
- (美)加里·F.马库斯
- 2404字
- 2022-01-04 17:33:55
1.1 全书预览
我写这本书的目的是将联结主义模型的研究与符号加工的准确定义结合起来。我希望通过关注不同联结主义模型之间的差异以及特定模型与符号加工的特定假设之间的关系,可以超越之前关于联结主义和符号加工的讨论。
我的陈述与以往不同。一方面,我没有采纳Pinker和Prince(1988)对消除型联结主义和实现型联结主义的区分。尽管我以前使用过这些术语,但出于以下几个原因在本书中避免使用它们。首先,人们经常将“仅仅”一词与实现型联结主义联系起来,好像实现型联结主义在某种程度上是不重要的研究项目。我避免这种负面含义,因为我不认同它们的前提。如果事实证明大脑确实在执行符号加工,那么实现型联结主义不会变得无关紧要。相反,这将是一个巨大的进步,相当于弄清楚大脑的一个重要部分实际上是如何工作的。其次,尽管许多研究人员质疑大脑是符号加工者的观点,但很少有人自认是消除型联结主义的倡导者。相反,那些质疑大脑是符号加工者的人通常会自认是联结主义者,但并没有明确说明他们支持哪种类型的联结主义。其结果是,很难明确指出什么是消除型联结主义(也很难辨别特定模型与符号加工假设之间的关系)。我没有重点关注这样一个定义不明确的区域,而是重点关注一类特定的模型——多层感知器。我之所以关注这类模型,是因为研究人员在考虑联结主义和符号加工之间的关系时,几乎总是要讨论这类模型。我要做的工作是仔细确定这类模型和符号加工假设之间的关系。预先假设多层感知器与符号加工完全不一致,将是不公平的先验判断。
我的陈述的另一个不同之处在于,与其他一些研究者不同,我的辩论不是关于符号,而是关于符号加工。在我看来,担心多层感知器本身是否使用了符号根本没有用。据我所知(见2.5节),这仅仅是一个定义问题。在认知架构的不同解释之间做出抉择,真正的工作不在于我们称之为符号的东西,而在于理解什么样的表示是可用的,以及我们用它来做什么。
在这方面,我要强调,符号加工不是单一的假设,而是一系列假设。在我进行重构时,符号加工包含三个独立的假设:
- 大脑表示变量之间的抽象关系
- 大脑具有递归结构化表示的系统
- 大脑区分个体的心理表征和种类的心理表征
稍后我将详细说明这些假设的含义。就目前而言,我的观点只是这些假设可以成立或单独不成立。结果可能是,大脑利用了变量之间关系的抽象表示,但并不表示递归结构化的知识,也没有区分个人的心理表征和种类的心理表征。换句话说,任何给定的模型都可以与符号加工的三个假设的一个子集或所有假设一致。实现型联结主义和消除型联结主义之间的简单二分法并不能解决这个问题。
因此,我将分别评估符号加工的每个假设。在每一种情况下,我提出了一个给定的假设,并询问多层感知器是否提供了替代方案。如果多层感知器确实提供了替代方案,我将评估该替代方案。在所有情况下,我将说明如何在神经机器中实现心理活动的各个方面。
最终,我认为与符号加工的假设一致的语言和认知模型比不一致的模型更可能成功。我所捍卫的符号加工——符号、规则、变量、结构化表示和个体的不同表示——并不是什么新鲜事物。例如,J. R. Anderson在他的认知架构的各种提议中都采纳了这些内容(例如,Anderson,1976,1983,1993)。但我相信,我们现在能够更好地评估这些假设。例如,在最近所有关于联结主义的研究之前,Anderson(1976,p.534)曾担心他当时为之辩护的架构可能“太过灵活,以至于它真的不包含任何经验主义,实际上只是为心理建模提供了一个媒介”。但是情况已经改变了。如果说Anderson在1976年没有什么可以拿来做比较的话,那么明显改变范式的联结主义模型的出现使我们看到,关于符号加工的假设是可以证伪的。人们想象的构建大脑的方式其实有很多种[2]。
本书其余部分的结构如下。第2章专门介绍多层感知器如何工作。虽然这并不是所提出的唯一一种联结主义模型,但它值得特别关注,因为它是最受欢迎的,并且它比其他模型都更接近于提供了一种替代符号加工的真正可行的解决方案。
在第3~5章中,我将讨论我认为的符号加工的三个核心原则,并在各种情况下,将它们与多层感知器认知方法中隐含的假设进行比较。第3章考虑了这样一个观点,即大脑具有机制和表示形式,这些形式允许大脑表示、提取和泛化心理表征变量间的抽象关系——这些关系有时被称为规则[3]。这些实体将使我们能够学习和表示某些类的所有成员之间的关系,并以简洁的方式表达泛化(Barnden,1992a;Kirsh,1987)。无须单独说明Daffy likes to swim,或Donald likes to swim等,我们就可以描述一个不引用任何特定鸭子的泛化,从而使用类型duck作为隐式变量。这样,变量将充当类别中任意成员的占位符。
与传统观点不同,我认为多层感知器和规则并不是完全对立的。相反,实际情况更加微妙。原则上,所有多层感知器都能表示心理表征变量之间的抽象关系,但实际上只有一部分可以这样做。此外,有些——而不是全部——可以在有限的训练数据基础上获取规则。在两个案例研究中,我认为,唯一能够充分捕获某些经验事实的模型是实现变量之间抽象关系的模型。
第4章为这样一种观点进行了辩护,即大脑有内在表示结构化知识的方式,例如,区分对the book that is on the table的心理表征和对the table that is on the book的心理表征。我展示的在多层感知器中使用最广泛的表示方案不能支持这样的结构化知识,但这种表示方案为如何在神经基质中实现这种知识提出了一个新的解释。
第5章主张大脑表示种类和个体之间的区别,例如区分菲利克斯猫和一般的猫。与之相反,我展示的多层感知器中使用最广泛的表示方案不能支持种类和个体之间的区分。本章最后简要介绍了如何实现这种区分。
在接下来的章节中,我暂时接受了大脑加工符号的假设,并且在第6章中讨论了如何在儿童的大脑中构建符号加工机制,以及这种机制是如何在进化过程中形成的。第7章进行了总结。
本书使用以下符号约定:粗体表示变量和节点,斜体用于提及而未使用的词,大写字母用于表示各种心理表征(猫、狗等)。因此,猫的概念将在心理表征中由种类CAT表示,在神经网络中由称为cat的节点表示,在文字叙述中由cat表示。