第二章
人如何学会语言

2.1 视觉与发音——像音关联

一个人是如何学会语言的?

这恐怕是个很难说清的问题,一如要说清人类语言的起源那样难。语言的起源问题充满高度争议,以至于在 1866 年当时的语言学界权威机构“巴黎语言学会”明令禁止讨论该问题,语言起源问题的讨论直到 1972 年才解禁,但至今仍充斥着各种说法[1][2]。然而,如果我们从一个人出生开始观察和思考个体的语言习得过程,或许对该问题也会有所收获。在这方面科学者们已经积累了丰富的经验和知识,而我们不太可能超越这些知识。尽管如此,在这里,我们仍需勉力为之,试着从一个容易被忽视的角度看待语言的习得过程,以获得语言与思维的某种关联,并重新理解语言本身。

当一个婴儿出生时,不会说话,眼睛还为睁开,只会哭。这时的TA(即他/她)不能独立生存,需要被照顾。父母是如何在不能与TA对话的情况下与之沟通并保证及时满足TA的需求的呢?

对成人来说,没有语言的沟通而了解彼此,在现代社会几乎是不可想象的。但对婴儿来讲,无需语言就能完成与成人们的沟通。刚出生的孩子沟通的手段只有一招,那就是哭。哭是人天生的本能,它基于每个人都有的相同的结构。人长大之后,或许因为对哭有深刻的历史体验而表现出对哭声本能地关注甚至烦躁,总会尽快想办法使周边的哭声停止或远离它们。对婴儿的父母而言,他们无法逃避婴儿的哭,只能试图去解决,而解决婴儿哭声的唯一正确办法就是设法满足TA,这样哭声自然就会停止。可是,婴儿的哭声代表什么意思呢?那只能去猜了。虽然网上的知识会告诉我们,婴儿的哭声有多种并代表不同的含义。但对于习惯了语言表达的成人们而言,分辨哭声远比分辨语言费事得多,大多数情况下还是要靠猜。沟通是为了满足需求,婴儿的哭也是如此,且更简单直接。婴儿的需求比较有限,基本上就四种:吃奶(饿了)、排泄(屎尿)、睡觉、舒服。所以,婴儿最初的声音,哭,可以代表着这四种需求。这些需求是很笼统而模糊的概念,因而婴儿的这个沟通手段是勉强而费力的。父母经常不知道婴儿到底需要什么而手忙脚乱,而如果TA的需求没有被猜对和满足,婴儿会继续哭个不停,直到成人们满足了TA的需求。如果我们能把语言的定义下得尽可能广义一些,我们甚至可以说,哭声是一个人最早的语言。

不久之后,婴儿睁开了眼睛。这时,TA多了一项技能,可以看东西,可以用表情交流。你对TA笑,TA也会笑,你对TA摆出凶恶的表情,TA会被吓哭。基于父母对孩子本能的喜爱,通常我们都试着对婴儿微笑,而婴儿也会报以微笑。微笑带给了TA良好的神经体验,激起愉悦的情感。婴儿的观察欲望很强,经常长时间地观察周边的人和事物。

婴儿的听觉在未出生时已经形成,而当TA不再酣睡,可以有清醒的时段时,就喜欢听人的声音,特别是母亲的声音。如同哭一样,视觉和听觉是TA的本能。人类与婴儿沟通时通常有个习惯,就是表情伴随着声音——我们一边微笑一边对TA说话。婴儿虽然不会说话,但听觉和视觉都非常敏感,TA的各种发声器官在祖先的数百万年的进化中已经被赋予了发音的潜质,跟随着成人的表情和声音,TA开始微笑并尝试发声,虽然可能TA并不知道自己在说什么。

随着身体和脑力的发育,TA到了幼儿阶段。此时,跟随着成人,幼儿开始偶尔发出成人能够听懂的声音,比如“妈妈”。这时,TA会从成人们的笑容和赞扬声中获得不一样的反馈,说明自己发出了正确的声音。虽然,TA并不可能知道什么是正确,但基于本能,TA希望看到笑容和听到笑声,这使TA感到高兴。而如果TA说错了,成人通常目无表情或略带失望,这是TA不喜欢的。因此,TA尽可能发出与刚刚成人发出的一样的声音,即正确的语言的发音,以获得情感上的奖励。对幼儿而言,成人的语言只是一种声音,它们通过听觉传递到TA的大脑被短暂地记录下来,再被TA通过发声器官模仿出来。成人们的反应会有利于或不利于TA记住刚才的发音场景: 如果成人们没有表现出愉悦的情感,TA因无法得到情感的反馈而放弃记住对自己发音的体验,即舍弃不正确的发音过程;如果成人们表现出正向的愉悦情感(自然的笑容或声音里传出的愉悦情绪等),TA因喜爱这情感而倾向于记住这体验,从而利于记住自己刚才的发音,即记住正确的发音。不正确的发音有很多,而正确的发音只有一种,记住正确的发音显然也要比记住不正确的发音要简单。久而久之,正确的发音过程不断被强化,TA能够跟随着成人的发音而对少数简单语言发出正确的发音。而如果TA能够不在成人发出某个词语发音的提醒下,自发地发出这个词的声音,我们就可以认为TA形成了简单语言的声音记忆(记忆这个词包含两层意思:记住+再现)。而在此之前,幼儿的跟随式的正确语言发音,只能看作TA形成了语言的印记或掌握了正确的声音反射技能。这是从声音角度考察幼儿的语言最初习得过程。这个过程可以以下面的关系链表示:

(成人的)语言发音→(幼儿的)声音暂记→(幼儿的)发音→(成人的)正向(情感)反馈→( 幼儿的)声音印记

这个过程还可简化为:

(成人的)语言发音→(幼儿的)正确发音→(幼儿的)声音印记

成人的语言发音,就他们自己能够听懂而言称之为语言,而对于刚会模仿成人的发音还不知道其涵义的幼儿而言,这还只能算是单纯的声音而已。中和二者对这种声音的理解,我们可以把它称之为语音。幼儿的这种声音印记或者说语音印记包含了两部分:语音的接收、语音的再现。前者是基于听觉对语音的接受,后者是基于发声器官对成人语音的模仿。这是一个从语音到语音的单向关联过程,即“音→音”的过程。我把所有单向关联的过程称之为“向连”——向是方向之意,连表示有方向性的连接。因而这个过程又可称之为“音音向连”。幼儿通过这种声音印记迈开了学习语言的第一步:正确发音(音→音)。正确发音的过程就是音音向连的过程。在此过程中,幼儿还只是单纯地发出语音,并不知道这个语音代表着什么意思。

成人们在教幼儿学语言时,还带着手势,说什么就指向什么。发“妈妈”的音,就用手指向妈妈;发“爸爸”的音,就用手指向爸爸;发“奶粉”的音,就用手指向奶粉罐。这个过程就是让一个人或物与一个声音(人或物对应的名称)同时在现场。幼儿在模仿成人发出某个声音时,就可以看到对应的人或物;或者,在看到某个具体的人或物时,总听到成人的对应发音而被引导去模仿。这样,TA逐渐明白了某个人或物与对应的固定声音要同时在场,而在TA的观察和正确的模拟发音同时做出时,基于视觉的事物的图像与声音印记也就在TA头脑中同时在场。这个过程可表示为:

于是,人或物与其名称的对应关系在主体(即这个幼儿)由外部体验到内部体验的过程中得到了强化,TA自然地在人或物与对应名称的声音之间建立了联系。其中,TA对这种联系的外部体验过程基于视觉和听觉,而对其内部体验过程基于视觉和自己的发声,即这种联系中的图像部分通过视觉被重复了两次,而声音部分则分别通过听觉和发声器官各自获得一次。在这里,视觉是沟通幼儿内外体验的公共区域。通过这种体验,幼儿获得了视觉图像与声音印记的关联印记,以及视觉系统与声音系统的联动练习。并且,有可能,此时幼儿还只是从事物图像到语音之间建立单向的联系印记,还不确定从那个习得的语音开始是否会返回到这个事物,因而,这种联系印记还只能称之为“向连”,尚不能称之为关联。这就是TA学习语言的第二步:像音向连(像→音)。经过此步骤,幼儿开始模糊地意识到习得的语音的含义了。这个过程可表示为如下关系链:

实际生活中,第一步和第二步几乎是同时发生的,我们只是为了论述的方便而做出上述人为的区分。在习得了像音向连后,如果幼儿不能确定先发出一个语音也将必然地对应其在像音向连中对应的那个事物或事物的图像,那TA还没有明白这个语音的含义。

现实生活中,成人不仅是指导幼儿认知语言与实物的关联,也需要从幼儿那里获得反馈以查看幼儿是否明白或掌握了这种关联。成人会在指向某人或某物时,伴随着疑问句如“这是谁?”,“这是什么呀?”等,幼儿刚开始自然不明白成人说的是什么意思,但TA能察觉语气的变化——疑问句与陈述句语气有明显的差异。等幼儿不知如何来对成人的问句做出反应之后,成人会再次重复所指的人或物的名称。此时,幼儿不但加强了对实物与语音的关联的熟悉,还明白了如何应对成人最初的问句,因为成人给出了“指物——问句——回答”的完整过程的示范。几次之后,幼儿会明白:问句的那个语气是成人向TA索要所指的人或物对应的那个发音。而如果随着大脑的迅速发育而使TA有了记忆能力,从而记住了所习得的像音向连,那么,看着眼前曾经见过的人或物,在成人的示范下,TA就可以将记忆中的像音向连再现出来,即发出该事物对应的语音,也就是说出该事物正确的名称了。在这里,幼儿相当于在成人的提问及示范下完成对像音向连的记忆的测试,其过程还是从像到音(像→音)的过程。不过,在通过成人的表情、语气或语音的良好反馈后而得知自己的回答正确时,TA也锻炼了从语音到事物或事物图像的向连过程,可以说是个“半音像向连”的过程。这是TA学习语言的第三步:语音回复(像←音)。

这个过程可表示为:

而当幼儿吃东西时,成人还会在自言自语或对TA说时,再次强调TA原本可能就听过的发音,比如,喂冲好的奶粉时,通过声音告诉TA“奶粉”。TA在喝奶粉的时候,又会把“奶粉”这个发音与正在喝的东西联系起来,也就是把味觉体验与这个实物名称的语音联系起来。这时,TA对“奶粉”这个语音所对应的内容得到了扩大或增强,即对奶粉这种物的内容得到了扩大或增强。而当TA身在母亲的怀抱里并听到母亲“妈妈”这个指引声音时,TA也增强了对“妈妈”这个语音的感受。也就是说,幼儿通过味觉体验和触觉等方式产生的情感体验,分别对某物和某人所蕴含的内容或含义得到了扩展,而TA能表达这些人和物的方式就是TA所学会的这些人或物的名称的语音。在经过了上述第三步的熟悉之后,一旦在某些时刻,如果环境触发了TA已经酝酿着的需求,比如,饿了并看到奶粉罐,或者情绪需要母亲的抚慰并看到母亲,TA可能自发地发出原本就受过训练的物或人的语音来,喊出“奶粉”或“妈妈”以表达自己的需求,并通过成人的正确反馈而获得了需求的满足。 这时,TA第一次学会了使用语言,并获得了神奇的体验,即不需要哭闹等无助的情绪表达,只需要简单动动嘴发几个声音就获得了想要的。初次成功的新鲜感促使TA今后更多地试图发出所熟知的名称的语音。虽然TA有时仍可能会有混乱,即发出的名称与实际的实物不对应,但立刻会得到纠正,不用多久,对熟悉的人或物,TA都能熟练掌握。

这里,我们仍需注意到,幼儿在最初学会使用语言的过程中,其发音也并非是盲目的,TA更可能是看到具体的且练习过了其名称的人或物,亦或是因需求(即TA寻找的已发生过的感觉)的反射而在大脑中寻找到了满足需求的人或物的图像记忆,而促使TA在已熟知的像音向连以及半音像向连中获得那个发音。而最初,更可能是这两个因素同时在场而起作用,这样更可能促使TA尝试使用语音。在这个熟悉的过程中,TA逐渐意识到,将像音向连反向操作即半音像向连的必要性,以获得需求的满足,并且随着图像记忆的增强而不再需要那个事物在场就可以重现像音向连,通过主动发声使成人将记忆印象中的事物重现于自己的眼前。这个促使TA主动应用语音的过程,可用如下方式表示:

这是TA学习语言的第四步:应用语音。应用语音这个过程表明TA彻底地可以将“像音向连”反向运用,即“音像向连”得以建立。到了这一步,TA对语言的学习已经可以说走过了一个简单的周期:

音音向连(音→音)、 像音向连(像→音)、半音像向连(像←音)、音像向连(音→像)

并在反复的运用中,将像音向连和音像向连强化为彼此固定的关联,我们可把它可称之为“像音关联”。语音和事物或事物图像虽然在这种关联中都很重要,但由于语音是为了表达事物而存在的,如我们常说“言之有物”。因此,我倾向于把代表事物或事物影像的“像”放在前面,以表示语音对事物的依附关系。至此,我倾向于认为,到了像音关联这一步,语音由最初的“发音”升级成了“语言”

由像音关联而来的语言由两部分构成:事物的影像、语音。最开始,这是一个把实物与语言发音对应起来的过程。并且,由于视觉不需要后天改造,通过视觉认识实物是个自然的认知反应,因而视觉是先于语言的先天能力;相对而言,语音需要后天模拟和练习,是后天获得的能力。视觉的获得先于语音的获得。我们可以把音音向连、像音向连两个部分理解为语言认知的环节,而把后两个部分理解为语言应用的环节。语言认知的环节是从实物到语音的对应过程(实物→语音)。而语言应用的环节则相反,是从语音到确认实物的过程(语音→实物):幼儿通过实物或实物的图像记忆发出对应的语音(像→音),成人接收到这个语音后拿给TA对应的实物作出回应(音→像),从而使幼儿感知到像音向连的反向操作即音像向连,是有实际用处的,从而建立起像与音之间的双向联系,即像音关联得以建立,继而使个体的语言得以初步实现。当然,在这个过程中,幼儿个体语言的最后实现,离不开作为听者的成人的反馈。

当然,不仅是视觉和语言之间可以关联,其它感觉与语言之间也可以建立关联。如把尝到的味道和其对应的语言词关联起来,孩子懂得“甜”、“苦”、“酸”这样的语音代表着怎样的味道,建立味音关联;把闻到的味道与成人教的“香”、“臭”这样的语音关联起来,建立嗅音关联;把不同的触感与习得的对应的语音联系起来,知道“热”、“冷”、“软”、“硬”、“湿”、“干”这些词代表着怎样的触觉,建立触音关联;把听到的声音的大小与对应的语言发音联系起来,明白“安静”“吵闹”是怎样的声音强度,建立听音关联。可以说,语言就是我们把感觉与声音建立起关联的过程。而这些与感觉直接相关联的简单语言可称之为直观词

不过,在最初阶段,我倾向于认为,幼儿不太可能知道将听到的词语的语音与一个事物被看到、被听到、被闻到、被接触到、被尝到等感觉中的哪种感觉联系起来。因此,当TA听到成人发出一个语音且不知道该与哪种感觉对应的情况下,通常会采取视觉优先的原则,先把这个语音与视觉看到的景象对应起来,得到像音关联并率先学会它。而其它感觉与语言的语音的关联,可能是随着幼儿的发育稍后发生,甚至最初有可能是附带于视觉之后一并被接受的,并在对以视觉认知的不同事物的同一种感知的抽象中最终明白成人的那个发音是不针对视觉图像而是针对其它的某种感觉的感知并与之关联的,例如,成人通过指向使孩子明白“奶粉”、“蛋糕”的语音对应着怎样的视觉实物,并在TA喝或吃这些东西时说出“甜甜的奶粉”、“甜甜的蛋糕”这样的话,多次之后,孩子最终明白了“甜的”或“甜甜的”这样的语音对应的是尝到的那种感觉,而不是看到的东西。随着其它感觉与语音的关联的发生,它们逐渐联合上视觉的像音关联,向句子那样的复杂语言迈进。