摘要:《古籍印刷通用字规范字形表》的发布实施,是我国汉字规范工作的又一次重要实践,填补了我国繁体字字形规范方面的空白,体现了研制者对繁体字字形规范问题的当代思考。繁体字在当今社会文化生活中仍具有重要的应用价值,但在实际应用中存在着较多问题,必须加以整理规范。对繁字体进行规范,必须既尊重古籍用字的事实,又立足当代的视角,坚持“优选”的原则和古今沟通、两岸四地沟通的理念,在科学性和适用性之间寻求最佳的契合点。
一、繁体字的当代地位
1.繁体字的法定地位
新中国成立后,为了方便广大人民学习和使用汉字,国家大力推进汉字简化工作,并于1956年1月28日由国务院发布了《关于公布<汉字简化方案>的决议》,从此,简化字和繁体字正式成为一组对应的概念。《决议》规定:“汉字简化方案分三部分。第一部分即汉字简化第一表所列简化汉字共230个,已经由大部分报纸杂志试用,应该从1956年2月1日起在全国印刷的和书写的文件上一律通用;除翻印古籍和有其他特殊原因的以外,原来的繁体字应该在印刷物上停止使用。”同时规定,第二部分即汉字简化第二表所列简化汉字285个,和第三部分即汉字偏旁简化表所列简化偏旁54个,开始试用。1964年2月,国务院同意中国文字改革委员会根据试用的结果编制《简化字总表》,并于次月由中国文字改革委员会与文化部、教育部联合发布,并在发布通知中明确汉字简化的对象是“在一般通用字范围内”。《简化字总表》仍然分为三部分,第一表收录352个不作偏旁用的简化字,第二表收录132个可作偏旁用的简化字和14个简化偏旁,第三表收录用第二表中的简化字和简化偏旁类推出来的简化字。1986年重新发布《简化字总表》时作了个别调整,并重申“凡是在《简化字总表》中已经被简化了的繁体字,应该用简化字而不用繁体字”。
上述文件的核心内容是简化字的原则和范围,对于与之对应的繁体字在哪些场合还能够继续使用,除了《决议》中所说的“翻印古籍和有其他特殊原因的”这样一个笼统的范围外,没有更多的表述,以致在很长一段时期内,有不少人认为只要写繁体字就属于不规范现象,甚至满大街查抄繁体字匾额招牌。直到2000年颁布的《中华人民共和国国家通用语言文字法》,才对繁体字的适用范围有了较为具体的说明。其中的第十七条规定:“本章有关规定中,有下列情形的,可以保留或使用繁体字、异体字:(一)文物古迹;(二)姓氏中的异体字;(三)书法、篆刻等艺术作品;(四)题词和招牌的手书字;(五)出版、教学、研究中需要使用的;(六)经国务院有关部门批准的特殊情况。”至此,繁体字才被赋予了特定的法律地位,部分消除了人们的误解。实际上,我国香港、澳门、台湾地区至今仍在使用繁体字,这也是符合一国两制的基本国策的。既然繁体字在当今社会文化生活中仍然具有重要的应用价值,我们就不能回避繁体字的使用问题,而是要认真研究繁体字使用中存在的问题,并进行科学的规范和引导。
2.《通用规范汉字表》对繁体的态度
2013年,国务院颁布了面向现代汉语通用层面的用字标准《通用规范汉字表》。尽管这个字表是针对简化字的,但在研制过程中也难免涉及到如何对待繁体字的问题。鉴于汉字简化过程中有部分不符合优化原则的地方,在字表研制之初,曾有过调整个别简化字字形的呼声。研制组经过反复调研,综合多数人的意见,最终认为:简化字中确实存在个别不合理的现象,但汉字简化的总体原则和方向是正确的,绝大多数汉字的简化是科学的;而且简化字习用已久,如果恢复部分繁体字,会增加学习和记忆的负担,造成文化普及与基础教育领域的波动,不利于社会用字的稳定;(王宁,2014)虽然不合理的简化字是少数的,但如果进行调整必然会涉及一些系统性的问题,需要进行大量扎实的科学研究与社会调查,等待时机成熟后再作处理更为稳妥。同时,根据国务院1986年重新发布《简化字总表》时关于“今后,对汉字的简化应持谨慎态度,使汉字的形体在一个时期内保持相对稳定”的指示精神,《通用规范汉字表》对类推简化采取了严格掌握的原则,一般不再扩大类推的范围;除了少数已经为社会习用并符合《简化字总表》规定的类推简化字增收到字表之外②,凡是未收入字表的字均不再类推。
另一方面,《通用规范汉字表》在提供现代汉语通用层面用字标准的同时,也十分重视繁体字的正确使用问题。《通用规范汉字表》专门附列了《规范字与繁体字、异体字对照表》,收录了与2546个规范字相对应的2574个繁体字,对96组一个规范字对应多个繁体字(或传承字)的字际关系进行了分解,并依据《简化字总表》的规定,对在部分义项和用法上不简化的字加以注释说明。《通用规范汉字表》对繁体字使用问题的关注,是基于人们对繁体字日渐陌生的社会现实的。作为在特殊领域具有法定地位的繁体字,人们对其缺乏必要的学习和了解,在应用中出现诸多问题也就在所难免了。
二、繁体字应用的问题及其规范的必要性
汉字规范的重点领域是电脑字库,繁体字规范也是如此。我国最早的汉字编码标准字符集是1981年实施的《信息交换用汉字编码字符集基本集》(标准号为GB2312-80),这是一个面向简化字的汉字编码字符集,共收录6763个简化汉字。1990年发布了与GB2312字符集相对应的繁体字编码字符集GB/T 12345-90,全称为《信息交换用汉字编码字符集·辅助集》,这是我国第一个关于繁体字的编码标准。所谓“辅助集”,是与“基本集”相对应而言的。该字符集是将GB2312中的简化字用相应的繁体字替换而成,在GB2312字符集的基础上增收了103个汉字,总字数为6866个。1993年的GB13000.1(等同采用国际标准ISO/IEC 10646.1-1993)是一个简繁兼收的字符集,共收录CJK统一汉字20902个。即使如此,仍无法满足印刷古籍的用字需要。后来ISO10646工作组又在原来的基础上进行了多次扩充,使收字的数量达到了9万多个③,缺字的情况有所缓解。
但由于字符集中包含中国以外其他国家的汉字,认同规则不够严密;即使是中国大陆提交的汉字,也没有进行系统的字形整理,字际关系非常复杂,缺乏统一的用字标准,给使用者带来极大的不便,古籍出版及数字化的质量受到很大影响。其主要问题表现在以下几个方面:
1.我国此前一直没有关于繁体字的字形标准。
1965年由文化部和中国文字改革委员会联合发布的《印刷通用汉字字形表》,规定了6196个印刷通用汉字的通用字体(即宋体)的标准字形,是面向现代通用汉字的字形规范标准。但由于该字表并没有提供详细的字形整理细则,人们只能从其字形选择的结果来倒推其中的原则。(费锦昌,1983)从最终确定的字形可以看出,《印刷通用汉字字形表》在确定字形规则时,更多地照顾了现代时期的字形特点,并没有考虑古籍印刷的需求问题,其字形与古籍中实际字形之间产生了一定的距离,不适合作为古籍印刷所使用的繁体字的字形规范原则。但是,《印刷通用汉字字形表》发布之后,却对繁体字字形带来了很大的影响,不少字模或字库制作者往往把繁体字形也按《印通表》中的字形去类推,国际编码字符集“对许多繁体字都同时收入了新旧两种字形。例如‘产’的繁体,它同时收入了新字形‘産’和旧字形‘產’。……在老式汉字中搀杂进新形字体,在新式汉字中搀杂进旧形字体,都有违字体统一的原则。在某些字处理软件上,有时竟打印出新旧字形相互穿插的词语,如‘轉换、鬥争、异樣’等,实在令人哭笑不得”(刘竹琼,2004)。同一个字或同一个部件在同一文本甚至同一句话中新旧字形使用不统一,如“沒-没”同时存在,“摇遥瑶-搖遙瑤”在一个文本里忽为前者、忽为后者,“爲僞潙-為偽溈”在正文里和注释里、在辞书的字头和行文里都可以发现两种字形并存的情况。再从两岸四地的使用情况看,“目前,内地使用新字形;台湾在部分沿用传统老字形的同时,也有一些采用了新字形,有的字形部件还有另外的新改变;香港在参用台湾地区字形的同时,另有一些字形部件坚持了自身选择。新字形的采用与传统旧字形的沿用及改造,致使两岸三地④之间的字形转换增加了复杂性。……在内地学者用繁体字撰写的同一篇论文中也可以看到,内地新字形、传统字形、台湾字形来回换用的情况。由此可知,当字形标准及其应用原则未能给出明确指向的时候,往往让使用者无所措手足”。(程荣,2014)
2.ISO10646国际编码字符集。
ISO10646国际编码字符集收录了9万多个汉字,单从数量上看确实已经够多的了,但这个字符集只是个编码字符集,而不是规范字集,其中的汉字来源复杂,按照收集的顺序逐级累积,异写字、异体字没有经过专业的整理认同,内部关系十分混乱。“信息处理用字标准同社会通用的标准之间本来是可以统一,也应该统一起来的,但是由于某些客观原因, 现在二者之间也存在不少差异和矛盾。”(仲哲明,1994)如仅在基本集和扩A中,“剑”对应的繁体就有“劍、剣、劎、劒、剱、劔”多种异写字形,这些字形不分层级地堆积在字符集中,没有明确的选用标准和指引,给用户的选用带来很大的困惑,必然导致在具有应用中分歧严重。普及层面的古籍整理,一个重要原则就是在保持原著语义的前提下尽可能有利于今人阅读,如果保留异体字,特别是那些较为生僻的写法,就会增加阅读的难度。如“墬-地”“堃-坤”“埜-野”几组异体字中,除非有特殊需要,前一种写法完全可以替换为后一种写法。但由于对字际关系缺乏了解,整理者不敢替换。甚至时而替换时而不替换,造成异形词纷呈,对电子版的检索形成困难。例如:有的古籍“註釋-注釋”“沽酒-酤酒”在同一页里并存;经常弄不清“忤逆”與“迕逆”、“抵牾”与“抵啎”是不是一个词,更难确定该写哪个更为妥当。有些整理者遇到不熟悉的字,只要在字库中找不到完全同形的字,就在用户区自行造字,产生了大量本该认同却另外造字的“新字”,使汉字在古籍整理领域里冗余现象越来越多,严重影响了古籍的当代传播。
3.字形问题。
由于ISO10646国际编码字符集没有对字形进行系统整理,同一部件在相同位置的写法也不统一。如基本集收录“敝”作上部件的字共20个,对于“敝”左部件第五笔横折钩是否带钩,处理不一致,其中“嫳幣彆撆斃暼獘虌蟞蹩鄨鐅鱉鳖鷩鼈龞”等17字去钩变形,“弊憋瞥”等3字未变形。对于这种处理不一致的情况,没有任何理由可以解释,完全是规则或操作上出了问题,从而导致各种电脑字库也因之产生混乱。有时还会因为对笔形处理不当而形成古籍中从未出现过的错字。如字符集中的“”字传世字书未见,经杨宝忠考证,字符集的字形应当是“”字误造,而“”为“㼌”字俗讹。(杨宝忠,2005)《字汇补·丿部》:“,音义同愈。”《说文》:“㼌,本不胜末,微弱也。从二瓜,读若庾。”徐锴《系传》:“瓜根弱而实奇大,故二瓜为㼌,会意也。”可见,“”传世字书有这样的写法,可以视为“㼌”的异写字;但“”历代文献不见,是字符集造字时造错了字形。
4.繁体字字形规范的重要任务之一就是要定码。
“由于汉字进人计算机后是以‘内码’ 的形式存储,又是以‘交换码’来调用的,所以,‘码’便成为人机对话不可或缺的属性。”(王宁,2019)但如果深入到现行的汉字国际编码中去考察,可以发现一些较为严重的情况:
同一古籍或辞书中的同一个字有不同写法,这些异写字有些在同一码位上,例如:
总的来说,尽管大家已经在汉字整理和古籍数字化方面做了不少的工作,但实际用字情況仍不理想:一方面缺字现象依然存在,另一方面由于编码字符集中的汉字整理程度较差,面对各国、各地区、各时代汉字的纷繁状况,认同机制不健全,古籍印刷用字的混乱现象并没有解除,这些不正常的现象越攒越多,严重影响了古籍印刷的质量,也突显了繁体字整理与规范的必要性和迫切性。
繁体字的整理与规范,可以提升以古代典籍为依托的中华优秀文化传承和传播的效度,是历史文献走入当代的必要条件,对于赓续文化根脉、增强文化自信具有重要的文化战略意义。而且,由于世界上仍有部分国家和地区使用繁体字,繁体字的整理与规范对于当代语文生活也具有现实作用。《古籍印刷通用字规范字形表》的发布实施,与《通用规范汉字表》形成互补态势。《通用规范汉字表》主要用于现代汉语用字、中小型工具书用字、中小学教材和教辅读物中文言文用字、一般古籍普及读物等。而《古籍印刷通用字规范字形表》则主要用于古籍印刷出版与数字化物,以及日常应用的繁体文本等。两个规范标准相辅相成,将会大幅提升汉字应用的国际化、标准化水平。
三、繁体字字形规范的当代视角及认同层级
1.繁体字字形规范的当代视角
如上所述,《古籍印刷通用字规范字形表》的研制,主要有两个服务目标:一个是古籍的当代传播,一个是当代语文生活中的繁体字应用。这两个目标都是立足于当代视角的。这就要求我们在对通用层面的繁体字字形进行规范时,必须遵从科学性和适用性兼顾的原则,立足现代社会对古代文献阅读和传承的需求,力求为当代非语言文字学专业的读者排除古籍阅读的障碍,尽可能对古籍当中自然分布的汉字字形进行系统整理,使一个个散见的字样上升到字种的层面,从而形成一个科学系统、关系明晰的古籍印刷通用汉字字符集。这与以往古籍数字化整理的视角是很不相同的。以往的大型古籍整理以追求保真为目标,古籍中的异写字形不加认同地如实再现。这样做的好处是可以尽量保存古籍的原貌,但对于没有专门接受过文字学训练的读者来说,大量的异构字和异写字形会严重影响对古籍的阅读和理解。而且古籍中的字形可以说是千姿百态,要想全部保留下来也是不可能的。因此,只有把繁体字规范的视角定位于服务于当代、服务于大众层面的文化传承,才是切实可行的。
2.繁体字形差异的层级
基于当代视角对繁体字进行整理和规范,首先必须确立科学的字形认同原则。古籍整理领域的字形认同原则与计算机编码字形认同原则有着本质的区别。计算机编码为了保存一个字的不同形体,往往为所有收录的写法都赋予不同的编码,如“户”字有三个编码:户(6237),戶(6236),戸(6238 );“散”字有4个编码:散(6563),(22FF1 ),𢿨(22FE8 ),(23019 )。但古籍整理则需要根据不同的需要来决定对不同字形的保留尺度,因而也就需要对古籍中的字形差异类型进行详细的梳理归纳。
汉字的形体关系可以划分为三个层级,即字样、字位和字种。字样是指对文本中具有记词(或语素)功能、写法大致相同的字形归纳在一起而形成的字形聚合。字位是指将构造意图相同的字样归纳在一起而形成的字形聚合。字种是将记词功能完全相同的字位归纳在一起而形成的字形聚合。
不同写法都是有意义的,都需要予以保留。因此,对于小学类古籍的整理来说,字形认同的原则是要最大限度地存真。
文化类古籍是服务于古代文化研究的。相对来说,异写字的内部差异与文化的关联较小,而异构字的形体差异往往是由于文化原因造成的,因而也就具有一定的文化学价值。如上面所举的“罰-罸”一组异构字,宋代郭忠恕《佩觿》归入“立教”一类,其卷上“造字之旨”中云:“刑罰从寸(古罰如此。谓持刀詈之。《元命苞》改‘刀’作‘寸’。寸,法也),应从士(古如此。汉文帝以言多非诚,乃去口从士),曡恶太甚(古曡如此。言决罪三日得宜,新室以三日太盛,改作三田),媒贵为神(《月令》注以其高禖为神,故从示),其立教有如此者。”通过郭忠恕的解释我们可以了解到,“罰”的异构字“罸”,“”的异构字“對”,“曡”的异构字“疊”,都有着特殊的文化意义,虽然有的解释不一定科学,但也不失为一种民俗文化,对于研究汉字形体与中国古代文化之间的关系还是有一定价值的。因此,对于文化类古籍,字形认同时应尽可能保留异构字。
普及类古籍主要是面向大众传播古代典籍和文化的,这些典籍所使用的一般是通用层面的繁体字和传承字形,只要能够准确传达原著的内容,就无需保留每个字的不同写法。绝大多数的阅读者并没有受过专门的文字学训练,能够阅读繁体字的古籍就已经是较高的要求了,如果保留异构字以及异写字,会增加人们阅读的障碍,甚至会影响人们的阅读兴趣,从而降低古代典籍和文化传播的效果。因此,对于普及类古籍,字形认同的原则是最宽松的,只要属于同一个字种,就可以加以认同。
这次发布的《古籍印刷通用字规范字形表》,顾名思义,就是面向古籍印刷通用字的。之所以称作“古籍印刷通用字”而不称“繁体字”,是因为古籍当中的字并不都是繁体字,只有那些后来经过简化、在国务院发布的《通用规范汉字表》所附《规范字与繁体字、异体字对照表》中有对应简化字形的字,才能称为“繁体字”。没有对应简化字形的汉字,都是历代传承而来的,在“古籍印刷通用字”系统和现代“通用规范汉字”系统中的字形是一致的,这部分字不宜称作“繁体字”,只能称作“传承字”。所以《古籍印刷通用字规范字形表》以“古籍印刷通用字”命名要比以“繁体字”命名更为科学,不容易引起误解。⑤这里强调“古籍印刷通用字”,就排除了小学类古籍所收的大量生僻字,而主要面向普及类古籍及部分文化类古籍,因此,《古籍印刷通用字规范字形表》在字形认同方面保留了部分较为通用的异构字,异写字全部加以认同,不予保留。
四、繁体字字形规范的选形原则
《古籍印刷通用字规范字形表》与《通用规范汉字表》相比,在字形标准确定方面的最大差别是:前者是字形“优选”,后者是字形“优化”。“汉字系统优化是指汉字系统通过自身调节和人工干预,从而使其内部结构及外部效用都达到最佳状态。依靠自身调节的优化称作自然优化,依靠人工干预的优化称作整理优化。”(王立军,2014) “优化”旨在引导汉字系统朝着更加健康的方向发展,“优选”则是对既有字形的整理选择。“优化”为了使汉字系统达至最佳状态可以进行人工干预,但“优选”只能在已有的字形中进行选择,而不能对字形进行加工。按照“优选”原则选出来的字形必然是历史字形,也就是古籍中真实使用过的字形。《古籍印刷通用字规范字形表》坚持从古籍用字实际出发,遵从“优选”的总体理念,完全摆脱“新旧字形”的束缚,更有利于建构科学、适用的繁体字规范系统。(王立军,2020)
为保证所选规范字形的系统性,具体操作顺序是先确定部件的样式,再扩展到所从之字。部件主形的选择,按照多项属性有序确定,避免受主观因素的影响。其中最主要的原则有以下几点:
1.为了真实反映古籍用字的实际,当部件变体之间的通行度相差悬殊时,优先选择在以往古籍中通行度高的部件形体。例如:古籍中草字头绝大部分用4画的“”,很少用3画的“艹”,故选前者为主形;首笔为撇的“丢”在《四库全书》中的频次是314,《四部丛刊》中的频次是86,而首笔为横的“”在两部丛书中的总频次仅为10,故选前者为主形。
2.为了适应现代人的认读习惯,保持古今用字之间的沟通,当部件变体之间的通行度相差不大,而其中某种写法在当今的印刷体中也通行时,优先选择在古今都通行的部件形体。例如:“户”“戸”“戶”三种写法古籍中都较常见,其中前者是现在通行的形体,优先选前者为主形;“並”“”两种写法古籍中都较常见,其中前者现代也一直沿用,故选“並”不选“”;“兑-兌”“卯-戼”“-”之类的部件也是如此,选前者而不选后者。
3.为了更好地体现汉字的理据性和传承性,方便学习和理解,在满足前两个条件的情况下,选择字理明析或变异度较小的部件形体。例如:“爲”和“為”、“爭”和“争”两组字形,古代典籍中都常见,现代古籍印刷中也经常混用,应该确定一种写法为主形,以减少用字混乱。由于这两组字的本义都和手的动作有关,带“爫”字头的写法更能体现理据性和传承性,故选“爲”和“爭”为主形。现有字符集和电脑字库中在这方面处理很不一致,如“靜、淨、掙、睜、箏、崢”等字从“爭”,“錚、諍、踭、埩”等字从“争”,应统一改为从“爭”。
根据上述原则确定部件主形后,再根据部件主形优选整字字形,这样就从总体上兼顾了汉字的系统性、流通度、理据性等重要属性,体现了古今沟通和两岸四地沟通的基本理念,既充分照顾了古籍用字的特殊性,又注意与《通用规范汉字表》中的现代汉字规范字形相衔接,同时又尽可能不扩大两岸四地字形之间的差异,以求在科学性和适应性之间寻求最佳的契合点。
由于古籍用字数量众多,繁体字字形规范工作任重而道远,不可能一蹴而就。作为首次繁体字字形大规模整理与规范实践的成果,《古籍印刷通用字规范字形表》是具有开创性意义的,其中虽然还存在不少值得完善的地方,但随着该规范的逐步推广实施,必将有效提升古籍出版的质量以及当代语文生活中繁体字应用的水平,并逐步深化人们规范使用繁体字的意识。
附注
①2021年10月,国家市场监督管理总局、国家标准化委员会作为正式的国家标准文件向全国发布了《古籍印刷通用字规范字形表》,标准号为GB/Z 40637-2021。该标准由教育部、国家语委组织研制。字表的主要完成人为王宁、王立军、王晓明、杨宝忠、顾青、周洪波等。
②《通用规范汉字表》新收录的226个类推简化字中,166个曾被《现代汉语词典》和《新华字典》收录,51个见于其他多种辞书,9个出自频度较高的姓氏人名及现代科技用字。
③其中扩A增收6582字、扩B增收42711字、扩C增收4149字、扩D增收222字、扩E增收5762字、扩F增收增收7473字、扩G增收4939字,加上最初的20902个CJK统一汉字以及后来陆续补充到几个字集后的104字,共计92740字。
④现在一般称“两岸四地”。
⑤本文为了行文方便和便于阅读,仍然沿用“繁体字”的概念,其内涵相当于“古籍印刷通用字”。
[参考文献]
[1]程荣.两岸三地汉字字形问题探讨[J].中国语文,2014,(1).
[2]费锦昌.字形规范化的必要性和基本原则——《印刷通用汉字字形表》解说之一[J].文字改革,1983,(1).
[3]刘琼竹.字体、字形与新旧字形[A].汉字字形研究[C].北京:商务印书馆,2004.
[4]田小琳,赵志峰,钟昕恩.汉字字形对比之研究[J].辞书研究, 2022,(6).
[5]王立军.汉字系统优化的基本原则[J].语言文字应用,2015,(1).
[6]王立军.当代汉字应用热点问题回顾与思考[J].语言文字应用,2020,(2).
[7]王宁.再论通用规范汉字表发布的背景和制定的意义——兼论汉字规范保持稳定的重要性[J].云南师范大学学报(哲学社会科学版), 2014,(6).
[8]王宁.汉字全息数据库的学术理念[N].语言文字报,2019-01-23.
[9]杨宝忠.疑难字考释与研究(上编)[M].北京:中华书局,2005.
[10]仲哲明.关于语言规划理论研究的思考[J].语言文字应用, 1994,(1).
本文转载自《语言文字应用》2023年第1期
作者:王立军,北京师范大学文学院、民俗典籍文字研究中心教授,博导,主要研究方向为文字学、训诂学。