语音凸显在多音异形词整理中的作用*
文丨卜师霞
摘要:文章以37组“多音专用音项异形词”为研究对象,考察理据性、通用性、语音凸显和主形选择之间的关联。可以看到,在此部分多音异形词中,语音凸显与通用性、主形选取具有正相关的权重高于理据性。在此基础上,本文将视野扩大到其他多音项异形词上,均可以看出语音凸显与通用性、主形选取之间的密切关联,因此,对于多音项异形词应考虑到语音凸显在词形整理和辞书编纂中的重要价值。
关键词:语音凸显 异形词 词汇规范
引言
异形词整理是现代汉语词汇规范的重要工作。目前,正式公布实施的异形词规范为《第一批异形词整理表》(以下简称《一异表》),表外的其他异形词并未以规范文本公布。由于异形词主要是词汇问题,因此相关讨论多集中在语用、语义(包括词义和语素义)和字形,较少和语音相关联讨论异形词整理。本文试图从语音凸显角度来谈与异形词整理相关的一些问题。语音凸显的具体阐释详见下文。
多音异形词是指记录异形词的汉字是多音字。为更好的研究语音凸显在多音异形词整理中的作用,我们选取其中一类作为研究对象,即记录异形词的汉字是多音字,这一汉字在某一音项上组构成的某词与他词具有异形词关系,而这一音项除异形词外,并无其他构词。例如:“彷”有两音,音项一为“pánɡ”,如“彷徨”;音项二为“fǎnɡ”,仅用于组构双音词“彷佛”,且与“仿佛”具有异形词关系。由于音项二是专为“彷佛”而设置,因此,我们将之简称为“多音专用音项异形词”。为称说方便,我们把类似于“仿佛-彷佛”的异形词组分为两类:一是“多音专用音项异形词”,标记为A类;二是与A组构成异形词关系的词,我们将其称为B组。例如上文所举“彷佛”属于“多音专用音项异形词”,“仿佛”是与之对应的词条。以《通用规范汉字字表》中的8105字作为考察范围,利用《现代汉语词典》(第7版)进行语音标注核查,共得到37例“多音专用音项异形词”。
《一异表》说明中提出整理异形词的三个原则:通用性、理据性和系统性。一般来讲,对于异形词推荐词形影响因素的基本认识为:通用性是推荐词形的主要标准,而认为与通用性形成正相关的是理据性,因为“符合通用性原则的词形绝大多数与理据性等原则是一致的”。我们以“多音专用音项异形词”为对象,主要讨论在多音异形词整理中,影响通用性的不仅仅是理据性,语音凸显同样具有重要的参考价值。
为解决如上问题,研究思路如下:第一步,先以“多音专用音项异形词”作为封闭语料,因为“多音专用音项异形词”的特殊性,和异形词的另一形体用字比较,语音凸显度基本较低,以此论证语音凸显与通用性、主形选取的关联具有典型性,详见后文;第二步,将讨论从“多音专用音项异形词”扩展到其他多音异形词,对异形词整理提出建议。
语音凸显对比分析
在设定语音凸显度时,为了确定某一音项是否在语言中更为凸显,我们从音项记录的语素自由度来进行设定:第一,按照音项记录语言单位的自由度从高到低可分为三级:成词语素、非成词语素、无意义音节,自由度越高,其凸显度越强;第二,同时还需要考虑构词量的多少。例如“分”有2个音项:音项一为“fēn”、音项二为“fèn”。音项一记录的为成词语素且构成大量的复合词;音项二记录的为非成词语素且构词量较低。故音项一的凸显度要高于音项二。因此,结合本文研究对象,将语音凸显定为3个级别:
1级:记录的是成词语素或构词量大的非成词语素;
2级:记录构词量低的非成词语素;
3级:记录单纯词中的某一音节;
我们将语音凸显度用于某组异形词之间的比较,不仅仅要考虑到两个异形词之间的比较,同时,还要考虑到记录异形词的字在自身语音系统中是否凸显。以几组例子进行说明:
(1)蛤蟆-虾蟆
A.在“há”音项上,“蛤”“虾”都只能记录一个音节,语音凸显度相同,我们可以记作:蛤蟆=虾蟆
B.在“蛤”“虾”各自的语音系统中。
“虾”读“xiā”时,为自由语素,语音凸显度较高;读“há”时,只能记录一个音节,语音凸显度较低。“蛤”的两个音项均记录的为不成词语素,语音凸显级别相同。我们可以标注为:
“虾”的语音凸显度:音项“há”<音项“xiā”
“蛤”的语音凸显度:音项“há”=音项“ɡé”
因此,在各自的语音系统中,音项“há”,“虾”的凸显度低于“蛤”。
结合A和B,针对“蛤蟆-虾蟆”异形词的对比来说,“蛤”的凸显度高于“虾”。当然,语音凸显并非影响异形词整理的唯一因素,在这组异形词中,由于“蛤”跟“哈”字同属一个声旁,在表音性也较好,人们也乐于选用。
(2)切末-砌末
“砌”有两音项:音项一“qì”,为自由语素;音项二“qiè”,为非成词语素。“切”也有两音项:音项一“qiē”,为自由语素;音项二“qiè”,不仅可用于“切末”,还可组成其他词,如“亲切”“切合”等。在“切末-砌末”这组异形词中,形成如下对比:
A.在“qiè”音项上,“切”的构词能力高于“砌”,语音凸显度高。
B.在“砌”“切”各自的语音系统中
“砌”音项“qiè”<音项“qì”
“切”音项“qiè”<音项“qiē”
因此,针对“切末-砌末”异形词的对比来说,在该音项上,“切”的凸显度高于“砌”。
(3)划拳-豁拳
“豁”有三个音项,音项一“huō”,可独立运用;音项二“huò”,为构词语素;音项三为“huá”,只用于“豁拳”。“划”有两个音项,“huᔓhuà”,均可以独立运用。在“划拳-豁拳”这组异形词中,形成如下对比:
A.在“huá”音项上,“划”为成词语素,“豁”为非成词语素。
B.在“豁”“划”各自的语音系统中
“豁”音项“huá”<音项“huō”“huò”
“划”音项“huá”=音项“huà”
因此,针对“划拳-豁拳”异形词的对比来说,在该音项上,“划”的凸显度高于“豁”。
(4)战栗—颤栗
“颤”有两个音项,音项一“chàn”,可独立运用;音项二“zhàn”为构词语素;“战”只有一个音项。因此,在“战栗-颤栗”这组异形词中,形成如下对比:
A.在“zhàn”音项上,“战”为成词语素,“颤”为非成词语素。
B.在“战”“颤”各自的语音系统中
“颤”音项“zhàn”<音项“chàn”
“战”音项“zhàn”>(空位)
因此,针对“战栗-颤栗” 异形词的对比来说,在该音项上,“战”的凸显度高于“颤”。
(5)黄檗-黄柏
“柏”有两音项:音项一“bǎi”和音项二“bò”均为非自由语素;但音项二仅用于“黄柏”,构词量低于音项一。而“檗”仅有1音,组构词也只有“黄檗”,不存在对比,在其自身语音系统中自然是最高项。因此,在“黄檗-黄柏”这组异形词中,形成如下对比:
A.在“bò”音项上,两者均只能构成“黄柏”“黄檗”,语音凸显度相同。
B.在“柏”“檗”各自的语音系统中
“柏”音项“bò”<音项“bǎi”
“檗”音项“bò”>(空位)
因此,针对“黄檗-黄柏”异形词的对比来说,“檗”的凸显度高于“柏”。
从例1-3中,可见当一组异形词都有多个读音,常用读音语音凸显。从4、5中可以看出,当记录异形词的两个字,一个字为多音项,一个字为单一音项,其单一音项的凸显度常高于多音音项。因为单一音项在自身的语义系统中无比较项,最为凸显。
综上,我们对37组“多音专用音项异形词”异形词进行分析,A组的语音凸显只有2组高于B组,其他A组的语音凸显均低于B组。
理据性、通用性考察
晁继周(2004)指出针对构成类型不同的异形词,其整理原则也应作相应的区分。因此,为更好观察理据性和通用性在不同类型词汇中的作用,我们将37组异形词分为合成词和单纯词进行单独分析。
(一)理据性分析
理据性是异形词整理的重要原则,《说明》中以“规诫—规戒”为例,认为两词皆合语源,但“诫”的语素意义更切近词义,故以“规诫”为推荐词形。可见,在理据性上,《说明》采取了共时和历时兼顾的原则。《一异表》公布后,异形词整理的理据也是学者关注和讨论的重点。王迎春、谭景春(2021)在《说明》基础上,明确两类不同的理据,即语源理据和语义理据,并对语义理据进一步细化。既考虑到词汇的历史来源,又关注了词汇的共时结构。因此,本文在讨论理据性时,先将所涉及到的异形词按照结构分为单纯词和合成词,并以语源理据和语义理据两个角度进行讨论。
1.合成词的理据分析
(1)语义理据考察
语义理据“主要是指语素义和词义相吻合,也就是词语构成所表达的意义与构成成分所具有的意义一一对应,相互一致”(谭景春,2020)。这就涉及到语素意义的判断,本文对语素意义的确定以《现汉》(第7版)是否设置义项为标准。需要说明的是,在本文研究的合成词中,有些词中语素用字为专用字,例如:
“菉豆”中的“菉”在另一个读音lù下组成“梅菉(Méilù)”,为地名。而在“菉”下仅标注见“绿豆”。可见,《现汉》认为“菉”在“菉豆”中不具有语素意义,“菉豆”表达的意义无法与组构成分“菉”“豆”一一对应,“菉”是为“菉豆”的专用字,与此类似的还有“萹豆”。和其对应的异形词“绿豆”“扁豆”比较,前者是从字的角度提示语义信息,后者是从词的角度揭示语义理据,无法呈现出语义理据的高低,我们将此类视为语义理据等同。
比较特殊的是“夹肢窝-胳肢窝”,由于这组词前后产生异形的两个字“夹”“胳”均为多音字,且其中一个音项专用于此异形词。在该音项上,无论是“夹”还是“胳”均无独立意义,只是记音符号,因此,《现汉》(第7版)在两个字的该音项下均没有语素意义,且仅构成“夹肢窝”“胳肢窝”。但由于字形上,“月(肉字旁)”与人体有关,因此,“胳肢”与“夹肢”相比,从字形上提供和词义更为相关的语义信息。因此,本文认为“胳肢窝”意义理据高于“夹肢窝”。
A组与B组相比,语义理据低于B组的7组,如“划拳--豁拳”等;语义理据高于B组的1组,为“胳肢窝--夹肢窝”;语义理据相当的5组,如“佶屈聱牙-诘屈聱牙”。“佶屈聱牙”组,从整词来讲具有理据性,但作为单字的“佶”“诘”《现汉》均无“曲折”释义。
(2)语源理据考察
语源理据是指词语的最早形式,本文在语源理论考察中采用数据库核查方式,根据数据库为“中国基本古籍库”。例如:
划拳-- 豁拳
从历史来源来看,“豁拳”用例较早,用例为明代李日华《六研斋笔记》:“俗饮,以手指屈申相搏,谓之豁拳,又名豁指头。盖以目遥觇人为己伸缩之数,隐机斗捷,余颇厌其呶号。”“划拳”为晚出,贪梦道人《彭公案》:“剩下的给徐胜喝了,两人又划拳。”在“基本古籍库”中,“豁拳”“划拳”用例分别为90例和9例。《辞源》(第三版)中也只收“豁拳”,未收“划拳”。用例也为明代李日华《六研斋笔记》。
切末--砌末
《辞源》(第三版)释义为“元杂剧剧情中所用的演具,相当于今之道具”。”在“中国基本古籍库”中,“砌末”最早用例为宋代佚名的《戏文三种》“我收拾砌末恰来”,“切末”用例为民国《孤本元明杂剧》“排场热闹,切末繁多”。《辞源》首例为明李好古《张生煮海二》“仙姑取砌末科”,并标明后多省作“切末”。
因此,从数据库检索来看,在语源理据上,“豁拳>划拳”“砌末>切末”。根据此项标准,语源理据A组强于B组5例,A组弱于B组6例,文献用例时间基本相同的2例。限于篇幅,本文不再一一展开论述。
2.单纯词的理据分析
以上37例异形词中共有单纯词24例。包括连绵词、拟声词和音译词。王迎春、谭景春(2021)提出整理异形词的两类理据,并未谈及单纯词现象。晁继周(2004)指出通用性是连绵词词形选取的主要原则。本文在此基础上,希望得出连绵词的通用性是否也有理据的限制或其他因素的制约。
(1)共时语义理据分析
单纯复音词共时层面的语义理据无法用语素义和词义的关系来判断,故考察与复合词不同,由于其语素的单一性,字形中义符的选择往往是理据判定的标准。例如:“咯噔—格登”《现汉》(第7版)释义为“形容皮鞋踏地或物体撞击等声音。” 从义符和意义的关联来看,“咯噔”的义符与词义相关度更高。
按照义符构意来看共时理据,A组理据性强于B组无;A组理据性弱于B组6组。
A组和B组理据相当或难以判断18组,例如:“疙疸”组异形词,在《现汉》(第7版)中主词条为“疙瘩”,与其构成异形词关系的有“圪垯”“纥”“疙疸”。
【疙瘩】 ①皮肤上突起的或肌肉上结成的硬块。②小球形或块状的东西:面~|芥菜~|线结成~了。也作纥。③不易解决的问题:心上的~早去掉了|解开他们俩人中间的~。④〈方〉用于球形或块状的东西:一~石头|一~糕。⑤〈方〉麻烦;别扭。‖也作疙疸、圪垯。
从《现汉》(第7版)释义来看,“疙瘩”第①义项和疾病有关,采用“病字旁”作为义符符合形义统一原则;第②义项已经泛指“块状的东西”,其中也包括线状物结成块状物的和土块,针对后两种语境,“纥”“圪垯”的义符符合形义统一原则。因此,从共时的形义统一来看,这一组异形词在理据性上是等同的。再如:
乌涂—兀秃,《现汉》(第7版)释义为“①水不凉也不热(多指饮用的水):~水不好喝。②不爽利;不干脆。”,两个异形词在字形上均无法与词义构成关联。
(2)历时语源理据
“语源理据”是指历史上出现较早的词形。但由于很多单纯复音词历史久远,文献繁杂,由于版本不同,形体常常出现混用状态,与合成词存在很大不同。因此,在本文涉及的24组单纯词中,以“中国基本古籍库”为核查语料库,均难以判断时间先后,在此,我们将单纯词的语源理据均视为等同。
(二)通用性分析
《说明》将通用性原则作为整理异形词的首要原则,指出“符合通用性原则的词形绝大多数与理据性等原则是一致的。”“应根据科学的词频统计和社会调查,选取公众目前普遍使用的词形作为推荐词形”。我们利用《人民日报》图文数据库和BCC语料库对以上37组异形词的使用情况进行考察。按照A组、B组的出现频次,可以分为两类,结果如下:
表一
语音凸显与词形选择
(一)理据性、通用性、语音凸显与主形选取对比分析
我们同样以A组为视角,来对比以上分析结果中的理据性和通用性,由于理据性包括语义理据和语源理据,我们将语义理据和语源理据均强于B组的“+”,反之标为“-”,对于两种理据有差异或无法判断理据强弱的标为 “X”。通用性和语音凸显同上。在主形选取上,以《异形词整理表》和《现代汉语词典》(第7版)为标准。得出数据如下:
表二
第一、理据、语音凸显、通用性、主形选取均为正相关。如上表中的1-4类,共13例。如:“扁豆--萹豆”“绿豆--菉豆”等;第二、理据与通用性、主形选取不完成形成正相关,但语音凸显与通用性、主形选取正相关。此部分指上表中的5、6类,共4例。如:“切末-砌末”等;第三、理据均等或不足时,语音凸显与通用性、主形选取正相关。如上表中的7、8类,共19例。如“呼啦--呼喇”“徜徉--倘佯”“瘌痢--癞痢”等。
第9类比较特殊,理据性与语音凸显与主形选取正相关,但均与通用性不形成正相关。此类情况有1组,为“黄檗-黄柏”。
黄檗-黄柏
《说文》收“檗”字,并释义为“黄木也”。徐锴曰:“即今药家用黄蘗也,出金州。”后也可作“蘗”。可见作为药材此词最早作“黄檗”,现代汉语中“檗”也只用于“黄檗”一词。无论从语源理据和语义理据来看,“黄檗”均高于“黄柏”。但在通用度上,在BCC语料库中,“黄柏”为98例,“黄檗”为6例,前者远高于后者,通用性与理据性存在矛盾。在语音凸显上,“黄柏”低于“黄檗”(前文已分析)。可见理据性和语音凸显均不与通用度形成正相关。该组词《一异表》未收,在《现汉》中将“黄檗”作为主词条。
针对“多音专用音项异形词”可以得出如下数据:语音凸显与通用性形成正相关的比例为97.2%;与主形选取形成正相关的比例为100%。理据性与通用性形成正相关的比例为18.9%;与主形选取形成正相关的比例为21.6%。可见,对于多音项异形词整理,语音凸显比理据性具有更为重要的参考价值。
(二)语音凸显在异形词规范中的价值
本文为说明语音凸显与通用性、主形选取的相关性,选择了较为具有代表性的“多音专用音项异形词”作为研究对象。实际上,在《一异表》某些异形词的整理过程中,也考虑到了语音问题。主要体现在:
第一,当一组异形词,一个是只有单一读音,另一个是有多个读音,选用只有单一读音的为推荐词形。例如:
战栗-颤栗
两者理据相当,语音凸显“战栗”高(前文已分析)。《说明》曾指出“战栗”词频远低于“颤栗”,但在主形选择上却以“战栗”为主形。对此,《一异表》在此条下注释:
“颤”有两读,读zhàn时,表示人发抖,与“战”相通;读“chàn时,主要表物体轻微振动,也可表示人发抖,如“颤动”既可用于物,也可用于人。什么时候读zhàn,什么时候读chàn,很难从意义上把握,统一写作“颤”必然会给读音带来一定困难,故宜根据目前大多数人的习惯读音来规范词形,以利于稳定读音,避免混读。如“颤动、颤抖、颤巍巍、颤音、颤悠、发颤”多读chàn,写作“颤”;“战栗、打冷战、打战、胆战心惊、冷战、寒战”等词习惯多读zhàn,写作“战”。
很显然,《一异表》选取主形上指出“颤”两读的分别“很难从意义上把握”,为“避免混读”,在“战栗”等词上统一写作“战”。可见,选取“战”作为主形,是为了避免产生“混读”,因为“战”只有一个读音。因此,该组异形词整体是将语音作为重要的考虑标准。
第二,一组异形词都有多个读音,宜选是常读音的为推荐词形。例如:“划拳-豁拳”,上文已经从“语音凸显”角度论证了“划”比“豁”更具有语音凸显性,“划”“豁”均为多音字,但该异形词音项“huá”是“划”的常见读音。尽管“豁拳”在语源上出现更早,但《一异表》选择以“划拳”为主形。
此外,我们可以将研究视野扩大到其他具有多音项的异形词上,检验语音凸显度的价值,以“押宝-压宝”为例,在《现汉》(第5版)中,以“压宝”为主条,释义为:“赌博的一种。赌博的人猜测宝上所指的方向下注。也作押宝。”我们从语音凸显来看“压”有两个音项,“押”有一个音项,记录的均为成词语素。因此,在“押宝-压宝”这组异形词中,形成如下对比:
A.在“yā”音项上,两者均为成词语素,语音凸显度相同。
B.在“压”“押”各自的语音系统中
“压”音项“yā”=音项“yà”
“押”音项“yā”>(空位)
因此,“押”的语音凸显高于“压”。再核查BCC语料库中,“押宝”词频为210例,“压宝”词频为21例。《现汉》(第5版)作为主词条的词形“压宝”,无论在语音凸显度上还是词频上均低于另一个词形。因此,在《现汉》(第7版)中就已经改为“押宝”为主条。
再以“俯首帖耳-俯首贴耳”为例:
《现汉》(第7版)以“俯首帖耳”为主词条,释义为“形容非常驯服恭顺(含贬义)。也作‘俯首贴耳’”,“俯首贴耳”为副条。从语音凸显来看,“帖”有三个音项,“贴”有一个音项。在“俯首帖耳-俯首贴耳”这组异形词中,形成如下对比:
A.在“tiē”音项上,“帖”记录的为非成词语素,“贴”记录的为成词语素。后者高于前者。
B.在“帖”“贴”各自的语音系统中
“帖”音项“tiē”=音项“ti씓tiè”
“贴”音项“tiē”>(空位)
因此,“帖”的语音凸显低于“贴”。再核查BCC语料库中,“俯首帖耳”词频为102例,“俯首贴耳”词频为176例。也就是说《现汉》作为主词条的词形,无论在语音凸显度上还是词频上均低于另一个词形。人们愿意选择“俯首贴耳”应是在理据上也理解为“耳朵紧贴着”,同时,从系统性来看“紧贴”义也用“贴”字。可见,无论是理据、系统,还是语音凸显,“俯首贴耳”都更应成为优选,建议可以考虑以“俯首贴耳”为主词条。
余论
由以上分析,可得出两点建议:第一,对于多音异形词来说,在一组异形词中选取哪个词形作为主形,不仅仅考虑到理据性、通用性、系统性,同时也应将语音凸显作为重要的参考。而且,语音凸显度是显性的,比通用性、理据性更容易识别。第二,在语音规范中,如果将语音凸显值低的异形词作为非规范词形,而此音又仅仅只记录异形词,那么该音项也应在现代汉语中作为冗余予以删除。当然在这里我们还需要强调两点:第一,在异形词整理中,语音凸显只试用于“多音异形词”,当异形词存在多种读音问题时,就应该考虑读音标准,尽管有局限性,但在一些异形词整理中能发挥重要作用。第二,实际上,把读音作为参考标准,在《第一批异形词整理表》中已有所体现,说明提出读音标准是有实践和理论基础的。晁继周(2004)曾指出:“异形词的规范。有利于增进语文的应用效能,有利于减轻语文学习的负担。”词汇规范和语音规范相结合,既减少学习者词汇学习的负担,也减少语音学习的负担。同时,我们也看到,语言文字规范具有系统性,这种系统性不仅仅是指词内或字内语音和意义系统,同时也应包括不同规范之间相互协调和影响。语言文字规范和整理是系统性工程,应是多种原则协调的结果。
注释
附注
参考文献
本文发表于《辞书研究》2024年第5期,推送据作者原稿,引用请以该刊为准。
作者简介
卜师霞,北京师范大学文学院教授,博士生导师,北京师范大学文学院副院长、全国人大立法用语规范化咨询专家。主要研究领域为训诂学。曾参加《通用规范汉字表》研制工作和《辞源》(第三版)审定工作。代表性研究成果为《源于先秦的现代汉语复合词研究》。
特别鸣谢
敦和基金会
章黄国学
有深度的大众国学
有趣味的青春国学
有担当的时代国学
北京师范大学汉字汉语研究与社会应用实验室
北京师范大学文学院古代汉语研究所
北京师范大学文学院古代文学研究所
微信号:zhanghuangguoxue
文章原创|版权所有|转发请注出处
公众号主编:孟琢 谢琰 董京尘
责任编辑:吴瑾妍