博士论文 | 莫愁 -- 基于平行语料库的汉语体系统组合性研究

学术   2024-06-21 19:02   广东  

The Compositionality of Madarin Aspect:

A Parallel Corpus Study


基于平行语料库的汉语体系统组合性研究


莫愁

北京语言大学

作者邮箱:mochou@blcu.edu.cn


毕业院校:荷兰乌特勒支大学(Utrecht University,  The Netherlands)

导师: Henriëtte de Swart, Bert Le Bruyn



现代汉语普通话中没有欧洲语言常见的时(tense)标记,但是存在丰富的体(aspect)标记。普通话中的体标记涉及词汇体和语法体,体标记与句子中的动词组合后直接或间接表达与时间相关的语义。前人文献对普通话体标记的语义研究颇丰,但尚未形成大一统的体标记理论,许多体标记的语义还存在理论争议,需要实证检验和进一步的理论探讨。

有鉴于此,本文利用Time in Translation研究组建立的包括汉、英、德、法、西等语言的多语种平行语料库(详见https://time-in-translation.hum.uu.nl/),聚焦于汉语普通话不同类型体标记的使用情况,尝试采用聚合式翻译挖掘(Aggregated Translation Mining,van der Klis et al. 2017, 2021)方法,对涉及普通话主要体标记的多种理论分析进行实证检验。在此基础上,本文对动词与各类不同体标记组合的情况展开系统的句法和语义分析,主要包括动词不带体标记、动词带词汇体标记(动结式中的补语)和动词带语法体标记(“了1”,即词尾“了”)这三种情况,并按照由底层到顶层的句法结构顺序依次研究了它们的句法-语义组合过程。


1. 基于聚合式翻译挖掘方法的平行语料库实证研究

前人对汉语动结式中的补语、“着”“了”“过”等常见体标记以及无体标记的句子的分析有不同的观点,本文将这些观点归纳为有待验证的七组假设(同一组中的多个假设为竞争关系),作为聚合式翻译挖掘(ATM)实证研究的基础:


假设1 (H1)动结式复合词(resultative verb compound,即RVC):动结式复合词由动词加上补语构成,又称动结式结构。若采纳Li & Thompson1981)的分析,那么动结式复合词总是指称一个终结事件(culminated event)及其结果状态(result state)。


假设2 “了1

假设2a (H2a)若采纳Li & Thompson 1981)、Smith 1997)、Xiao & McEnery 2004)和Sun2014)的分析,那么“了1”是完整体标记(perfective marker)。

假设2b(H2b)若采纳Lin2006)的分析,那么“了1”是结果式完成体标记(resultative perfect marker)。


假设3 “过”

假设3a (H3a)若采纳Smith(1997)和Lin(2006)的分析,那么“过”是完整体标记

假设3b (H3b)若采纳Xiao & McEnery2004)的分析,那么“过”是经历式完成体标记(experiential perfect marker)。


假设4 (H4) “在”若采纳Smith1997)、Xiao & McEnery2004)、Lin2006)和Sun 2014)的分析,那么“在”是进行体标记(progressive marker)且要求与指称过程(process)的动词组合。


假设5 (H5) “着”若采纳Smith1997)、Xiao & McEnery2004)和Lin2006)的分析,那么“着”是非完整体标记(imperfective marker)且要求与指称过程或状态(state)的动词组合。


假设6 (H6) 动词重叠式采纳Smith1997)、Dai1997)、Xiao & McEnery2004)的分析, 那么动词重叠式是完整体标记。


假设7 无体标记的句子

假设7a (H7a)若采纳de Swart1998)的分析,那么无体标记的普通话句子的体特征是透明的(aspectually transparent)。其中,当句中谓词具有量化(quantized)特征时,该句具有事件性(eventive)解读;当句中谓词具有同质化(homogeneous)特征时,该句具有状态性(stative)解读

假设7b (H7b)若采纳Smith1997)的分析,那么无体标记的普通话句子具有既不是完整体也不是非完整体的中性体(neutral aspect)。

假设7c (H7c)若采纳Xiao & McEnery2004)的分析,那么无体标记的普通话句子使用非动态性的谓词时具有状态性解读,使用动态性的谓词时随语境获得完整体或非完整体解读。

假设7d (H7d)若采Sun2014)的分析,那么无体标记的普通话句子具有状态性解读。

上述假设的验证分两步进行。首先选取英语、德语、法语、西班牙语中部分兼有时和体语义的“时标记”为主要分析对象,通过对平行语料库中语料的聚合式分析,构建出一系列原型欧洲语言的时-体形式(tense-aspect form)。其次,观察分析汉语普通话翻译作品中体标记的使用与各类原型时-体形式的对应情况,将它们看作翻译等效物(translation equivalent),并通过归一化互信息(Normalized Pointwise Mutual Information, NPMI)对这种对应情况进行双向相关性(bi-directional association)测量。将测量结果与上述假设逐一比对,发现假设H3b“过”是经历式完成体标记)、H4“在”是进行体标记)和H5“着”是非完整体标记)得到了良好的统计数据支持,而统计数据排除了H3a(“过”是完整体标记)和 H7b(无体标记的句子具有中性体)的假设 ,其他假设未得到明显的数据支持,有待进一步的理论探讨。


2. 汉语体系统语义组合性研究

基于上述实证研究的结果,结合汉语体系统的理论考量,理论分析部分重点关注与H1H2H7相关的假设,依次研究了以下三类句子的组合性:1)动词无体标记的句子;2动词与补语组合的句子;以及3)动词或动结式复合词与“了1”组合的句子。研究发现:

首先,汉语无体标记的句子一般获得状态性解读(支持H7d),若要获得事件性解读,谓语则必须带有明确的终结点。这些终结点可以通过不同的形式体现:在动词层面主要是补语,小句层面包括如表程度的“得”结构、表示终结点的短语、致使结构中表结果的状态,跨小句层面包括直接与间接引语、终结点的动态标记等,本文将这些标记均分析为用于表终结点的体标记。

其次,当句子中的动词与补语结合形成动结式复合词时,此类句子具有事件性解读。本文重点讨论动结式复合词的三种子类型,即完成型动结式复合词(completive RVCs)、结果状态型动结式复合词(result-state RVCs)、趋向型动结式复合词(directional RVCs),对上述动结式复合词子类型的语义及其内部结构进行了分析。研究采用了Ramchand2008)的第一语段句法(first phase syntax)及其相关的后戴维森语义学(post-Davidsonian semantics)的理论框架。其中,第一语段句法聚焦于动词内部的句法结构,将vP由上往下分解为起始短语(initP),过程短语(procP, 和结果短语(resP);相应地,后戴维森语义学将事态(eventuality)划分为起始(initiation)、过程(process)和结果(result)三个阶段。

本文认为上述三种子类型的动结式复合词中的补语都位于结果短语内(作为其中心语res或其补足语),用于阐明事件的结果状态;而动结式复合词中的动词往往为起始短语和过程短语的中心语(当补语作为res的补足语时,动结式复合词中的动词也可能占据结果短语中心语的位置)。补语在自下往上的句法生成过程中与动词组合,组合后的动结式复合词指称一个终结事件及其结果状态。以“我写好信”为例,“写”自下往上分别占据了起始短语、过程短语、结果短语的中心语位置,补语“好”是结果短语的补足语,组合后的动结式复合词“写好”指称一个终结的“写”事件及其结果状态即“信写完了”,结构如图1所示。

图1  “我写好信”的第一语段句法分析


上述动结式复合词的质性分析结果与假设H1一致。鉴于此,本文认为,语料库相关性测试发现对H1的支持效果不明显,可能与汉语句子获得事件性解读的方式多样有关。汉语既可以使用补语,也可以使用前文提到的其他终结点体标记、“了1”等来使句子获得事件性解读。因此,动结式复合词与能使句子获得事件性解读的欧洲语言的时-体形式的双向相关性较弱。

论文最后讨论了“了1”的语义,并尝试分析动词或动结式复合词与“了1”的组合过程 本文结合Ramchand2008)对事件结构的分析与Lin2006)对“了1”的语义分析,提出“了1”的语义具有二元性,当“了1”与指称过程的谓词共现时是一个完整体标记,当“了1”与指称事件或状态的谓词共现时,是一个结果式完成体标记。假设H2a和假设H2b只分别刻画了“了1”语义中的一种情况,因此在前文的实证研究中均未获得明显的量化证据。从组合性的角度来看,“了1”在句法上可被视为AspP的中心语,其补足语为 initP“了1”语义功能是对事态的起始和过程阶段赋予完整体,对事态的结果(如存在)赋予未完整体。

主要参考文献

 
Dai, Y. J. (1997). Xiandai Hanyu Shiti Xitong Yanjiü [A Study of Aspect in Modern Chinese]. Hangzhou: Zhejiang Educational Press.

de Swart, H. (1998). Aspect shift and coercion. Natural Language and Linguistic Theory, 16(2), 347–385.

Li, C. N., & Thompson, S. A. (1981). Mandarin Chinese: A Functional Reference Grammar. Berkeley: University of California Press.
Lin, J.-W. (2006). Time in a language without tense: The case of Chinese. Journal of Semantics, 23(1), 1–53.
Ramchand, G. (2008). Verb Meaning and the Lexicon: A First-phase Syntax. Cambridge: Cambridge University Press.
Smith, C. (1997). The Parameter of Aspect (2nd ed.). Dordrecht: Kluwer.
Sun, H. (2014). Temporal Construals of Bare Predicates in Mandarin Chinese. Ph.D. dissertation, Leiden University.
van der Klis, M., Le Bruyn, B., & de Swart, H. (2017). Mapping the Perfect via Translation Mining. In M. Lapata, P. Blunsom & A. Koller (Eds.), Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics (Vol. 2, pp. 497–502). Valencia: Association for Computational Linguistics.
van der Klis, M., Le Bruyn, B., & de Swart, H. (2021). A multilingual corpus study of the competition between PAST and PERFECT in narrative discourse. Journal of Linguistics, 58 (2), 423–457.
Xiao, R., & McEnery, T. (2004). Aspect in Mandarin Chinese: A Corpus-based Study. Amsterdam: John Benjamins.


审校 | 张庆文、陈哲、程航(广东外语外贸大学)

设计排版 | 陈观恩、罗晓君、胡颜洁(广东外语外贸大学)

形式语言学研究
形式语言学研究与学术交流
 最新文章