第三章 音系学
3.1 导引
●音系概说
●音位和音位变体
●最小对立对
●互补分布
●音系特征
●音节结构
●音系规则
●结语
3.1.1 音系概说
上一章讨论了语音学。语音学研究语音的物理特性、产生机制和感知规律。和语音学不同,音系学研究语音的模式(the sound pattern),即语音的组织规律。语音学中的基本单位是单音(phone),而音系学中的基本单位是音位(phoneme)。语音学和物理学中的声学、人工智能研究中的语音识别有很多交叉,而音系学则是相对纯粹的语言学分支。在这一章,我们将介绍音系学中的常用概念,如音位、音位变体、互补分布、最小对立对、音节结构等。我们也将简要介绍如何进行音系分析。
3.1.2 音位和音位变体
在第二章里我们提到,人类可以产生和感知相当数量的语音(sounds)。在自然语言中,没有哪一种语言穷尽性地使用到所有可能的语音。每一种语言都是有选择的从语音库藏里面,选择某些“独特”的语音进行组织和搭配,形成一个具有对立性和规律性的语音系统。这个语音系统,就是音系系统,比如我们通常所说的汉语音系、英语音系、拉萨藏语音系等。研究音系系统规律的,就是音系学。
某一语言的音系系统分为三个层次。最明显的层次就是音段(segment)层次,主要是指不同的语音(如元音和辅音)之间的相互关系;比音段高一层的是音节,研究不同的音段组成比音段更大的单位;比音段低一层的是音系特征,每一个音段都可以分解为若干音系特征。我们之所以觉得两个音不同,就是因为组成它们的特征不同。音系系统的三层分立结构如(1)所示:
(1)音系特征→音段→音节(结构)
我们先从音段开始。我们经常会觉得某个人说话带有独特的口音,一个说普通话的北方人不需要在南京生活多久就会发现,老派的南京人经常把“大南京”读成“大蓝鲸”;我们也可以一耳就能听出“爸”和“怕”是两个不同的词——凡此种种,都和音系有关。换言之,音系的对立可以归结到音系中的基本单位——音位——的对立上。“爸”(发音[pa])和“怕”(发音为[pha])之所以是两个不同的词,是因为它们涉及到两个不同的音位:不送气的[p]和送气的[p](为以示区别,一般把送气的[p]记为[ph])。
语言学家把具有对立意义、能够区分不同词的语音叫做音位。音位具有辨义作用。在汉语中,送气的[p]和不送气的[p]就代表了不同的音位(因为它们可以区别意义)。属于同一个音位,但是不具有区别意义的语音叫做音位变体(allophone)。如果某些人经常把“大南京”读成“大蓝鲸”,一个可能的原因就是在这些人的音系系统中,[l]和[n]属于同一个音位的变体(也有可能是在它们的音系系统中,不存在和[n]相对应的音位)。语音系统的差异,主要是音位上的差异。语言不同,音位也不同。在汉语普通话中,送气的[p]和不送气的[p]表示不同的音位,但是在英语中不是。“pit”(发音[pɪt])和“spit”(发音[spɪt])中[p]的发音不同,前者是送气音,后者是不送气音,存在音质上的差异,但是英语母语者并不觉得音位具有辨义功能。也就是说,如果一个人把“spit”发成[sphɪt],听话人会觉得奇怪,但是不会认为这和“spit”是不同的词。然而,[sbit]和[spit]却有本质的区别,前者是浊爆破音,后者是清爆破音。清浊对立在英语中具有辨义功能。所以我们说[b]和[p]在英语中表示不同的音位,而英语中送气的[ph]和不送气的[p]就是音位变体。
为了区分音位和语音(以及音位变体),语言学家一般用“/ /”表示音位,用方括号“[]”表示人耳所感知到的具体的语音。如下(2)是英语中音位和音位变体之间的示意图:
(2)
在英语中,送气的[ph]和不送气的[p]属于音位/p/的不同变体。但是在汉语普通话中,送气的[ph]和不送气的[p]则属于不同的音位。母语为汉语普通话的使用者无法将两者视为同一个音位的变体,因为它们可以区别不同的词,具有辨义功能。如(3):
(3)a. 怕[pha4]、趴[pha1]、爬[pha2]、啪[pha]
b. 爸[pa4]、把[pa3]、吧[pa]、八[pa1]
(3a)中的是送气的[ph],(3b)中的是不送气的[p](1、2、3、4分别表示第一声、第二声、第三声、第四声,没有标记表示轻声)。(3a)和(3b)表示不同的词。在汉语普通话中,送气的[ph]和不送气的[p]分别代表不同的音位,如(4):
(4)
音位和音位变体的概念存在的前提是语言的音系有两个层次:音位变体是语音音段的物理实现,是具体的;而音位存在于说话人的音系系统中(储藏于人脑的语言知识中),是抽象的。音位变体是抽象的音位的实现。音位变体和音位之间是实现和被实现的关系。
3.1.3 最小对立对
音位是具有辨义功能、能够产生对立的语音。要确定两个音是不同的音位亦或同一音位的不同变体,一般通过最小对立对来判断。所谓最小对立对,指的是两个词(或其它语言单位)在所有位置上的音都一模一样,仅在同一个地方存在区别,且这个区别导致了两个词的意义不同,则认为这两个词组成一对最小对立对。上文提到的“怕”[pha]和“爸”[pa]就是一对最小对立对:它们在所有位置上的音都相同,只在词首的辅音存在区别,并且这一区别导致了两个不同的词。同理,“妈”[ma]和“爸”[pa]也是一对最小对立对。通过最小对立对,我们可以得出,[m]、[p]、[ph]属于不同的音位。但是,“怕”[pha]和“提”[thi]不是一对最小对立对,因为这两个词的音并不是只在同一个地方存在区别,相反,这两个词的音在每一个位置都存在区别。
下面的(5)和(6)各举了一些英语和汉语中最小对立对的例子。通过建立最小对立对,可以很直接地判定两个音属于不同的音位。
(5)布[pu4] 铺[phu4]音位:/p/ vs. /ph/
读[tu2] 图[thu2]音位:/t/ vs. /th/
稿[kao3] 考[khao3]音位:/k/ vs. /kh/
脚[tɕiao3] 巧[tɕhiao3]音位:/tɕ/ vs. /tɕh/
声[ʂəŋ1] 身[ʂən1]音位:/ŋ/ vs. /n/
(6)lacy[lejsi] lazy[lejzi]音位:/s/ vs. /z/
sum[sʌm] sun[sʌn]音位:/m/ vs. /n/
sing[siŋ] sin[sin]音位:/ŋ/ vs. /n/
3.1.4 互补分布
用最小对立对可以区分两个不同的音位。那么,如何区分同一音位的不同变体呢?语言学家通常采用互补分布(complementary distribution)的方法来区分音位变体。所谓互补分布,就是没有区别意义的两个音在不同的位置出现,并且这两个音出现的环境互相排斥。用通俗的话来说,假设x和y是两个不同的音,x音出现的地方,不会出现y音,反之亦然,那么这样的现象就叫做互补分布。
英语中的长元音[i: ]和短元音[i]的出现就呈现互补分布。[i: ]一般出现在浊塞音(voiced obstruent)之前,而[i]则出现在别的地方,譬如清塞音之前、鼻辅音之前等等。我们可以得出下面的规则:
(7)[i: ]和[i]的互补分布
a. [i: ]出现在浊塞音之前,如heed、seize、leave等。
b. [i]出现在别的地方,如heat、cease、leaf、seen等。
总而言之,两个不同的音可能会(也可能不会)产生词的对立,可能具有(也可能不具有)辨义功能。如果两个音导致了词的对立,具有辨义功能,则这两个音属于不同的音位;如果两个(不同的)音不会导致不同的词,不具有辨义功能,则这两个音属于同一音位的音位变体。我们用最小对立对来确定音位。同一音位的音位变体之间则存在互补分布。
3.1.5 音系特征
前文提到过,音系系统存在三个层次:(一)特征层次;(二)音段层次;(三)音节层次。上文讨论到的音位属于音段层次。在下一小节我们会介绍音节层次的结构。在这一小节,我们简单介绍一下音系特征。
音段可以分解为若干音系特征。各种音都是由特征组成的。音系特征来源于语音特征(见第二章),音系上音位的对立就是因为特征的对立造成的。不同的特征会导致音的不同。有的时候,某一个特征的不同也会导致音位的不同。能导致音位变化的特征叫做甄别性特征(distinctive features)。音系是因语言而异的,所以,一个语言中的甄别性特征,可能在另一个语言中不具有甄别音位的作用。在汉语中,送气/不送气的对立是甄别性特征,但是这一特征在英语中不具有甄别音位的作用,而是属于音位变体的语音特征。在英语中,清浊对立(voiced/voiceless)(又称“带声/不带声”)是甄别性特征,如[b]和[p]是不同的音位。它们之间的差异,就在于前者是带声的,后者是不带声的。
我们可以用音系特征分析法来描写音位。以汉语普通话中不送气的[p]和送气的[ph]为例,它们的音位特征可以用特征矩阵(feature matrix)描述如下:
上述特征矩阵很直观地描述了汉语普通话中不送气的[p]和送气的[ph]的重合与差异:它们除了在[±送气]这一特征上存在差异外,其他所有特征都相同。而[±送气]正是甄别这两个音的关键。
3.1.6 音节结构
音系系统分为三个层次:特征层次、音段层次和音节层次。前文分别讨论了音段层次和特征层次。这一小节讨论音节层次。两个或两个以上的音段组成音节。音节是比音段更大的单位。最简单的音节由元音组成(如英语中的“I”),常见的音节由辅音加上元音组成,形成CV结构(C: consonants; V: vowels)。不同语言的音节结构是不一样的。汉语普通话中的音节一般是CV(如果是CVC的话,音节末的C只能是鼻音,如“南”[nan])。汉语普通话不允许在音节首出现辅音串(consonants clusters), CCV结构不存在于汉语中,至少不存在于现代汉语普通话中。但是,很多语言允许在音节首出现辅音串。英语就是其中之一,如(9):
(9)a. CCCVC, 例:stream[strɪm]
b. CVCCCC, 例:sixths[siksθs]
英语允许音节首最多出现3个辅音:第一个一般是丝擦音[s],后面跟随一个不带声爆破音(如[t]),第三个音一般是流音或边音,如[r]或者[l]。在音节尾,英语最多允许出现四个辅音,如(9b)的音节末就是四个辅音串(CCCC)。
俄语的音节结构比英语更为复杂。俄语大量允许辅音串出现在音节首,如“vprog”(发音:[fprɔk]),就有三个辅音出现在音节首。
和语言中其他的结构一样,音节也具有层级性。用希腊字母σ表示音节,Onset表示音节首,Rhyme表示韵部,Nucleus表示韵核,Coda表示音节尾(韵尾),典型的音节结构如(10)所示:
(10)音节结构
(11)[bin]
如果一个词由多个音节组成,我们也可以像绘制树形图一样的,把多个音节连接起来,如(W表示词):
(12)phonetics[fənɛtiks]
[fənɛtiks]由三个音节组成,第一个音节的coda为空(用空集符号∅表示),第二个音节的coda也为空,第三个音节的coda有两个辅音。
当一种语言的词被“借入”另一种语言中的时候,如果这两种语言的音节结构不同,通常借入的词要进行音节化(syllabification)。如英语中的Amsterdam由三个音节组成,但是译成汉语,却成了五个音节(阿-姆-斯-特-丹)。音节化是借词音系中一个很常见的现象。
3.1.7 音系规则
前文我们区分了音位和音位变体(语音)。音位和音位变体分别代表了音段的两层表征。音位对应的是抽象的、语言使用者大脑中关于音系知识的表征,我们把这一层叫做音系表征(phonological representation)或底层表征(underlying representation, UR)。音位变体对应的是音位的实现,我们把这一层叫做语音表征(phonetic representation)或表层表征(surface representation, SR)。和音系表征不同,语音表征包含了一些和具体发音相关的信息。
我们感知到的语音是通过应用音系规则生成出来的。音系规则作用于音系/底层表征,生成语音/表层表征。这一构拟音系系统的方式,叫做推导(derivation)。推导总是通过规则来实现的。推导模型如(13)所示:
(13)
音系规则可以通过形式化的方式来表述。在当代音系学中,音系规则一般采用(14)的范式来表述:
(14)A→B / X_____Y
在表达式(14)中,A表示规则的作用对象(输入),B表示应用规则后所得到的结果(输出),“/ X_____Y”是规则所适用的环境,其中“/”表示“在……环境中”,“_____”表示受影响的音所出现的位置。这一规则非正式的表达是:“A变成B当A出现于X和Y之中的时候”。
我们可以通过一个简单的例子来说明这一规则是如何运作的。英语可数名词的规则变化是在词尾加“s”,如:dog-s, student-s, teacher-s, desk-s等。但是,当名词以[s, z, ʃ,ʒ,ʧ,ʤ]中的任意一个结尾时,在复数标记“s”和相应的名词中间要插入一个中性元音(schwa)“ə”。这一点也反映在拼写上:当相应的名词以s、z结尾时,复数标记要改为“es”。如:
(15)bus-es[bʌsəz],bush-es[buʃəz],badg-es[bæʤəz],garag-es[gæraʒəz],etc
这一现象可以通过一条插入规则(epenthesis)来刻画:
(16)中性元音插入规则
∅→ə/[丝擦音]_____[丝擦音]
规则(16)可以读成:在两个丝擦音中间插入中性元音ə。这一规则可以很直观地描述(15)所示的现象。
更多音系分析的实例,见Fromkin et al.(2013)第6章。
3.1.8 结语
人类语言中的音段可以区分三个层次:(一)音位特征;(二)音位;(三)音节。我们通过最小对立对来确定音位,通过互补分布来确定音位变体。音节分为音节首和韵部两个部分,其中韵部又可以分为韵核和韵尾两个部分。音位所对应的是音位表征(底层表征),我们感知到的具体的语音所对应的是语音表征(表层表征)。音系规则作用于底层表征的音位,生成表层表征层面上具体的语音。