自由合并框架下的多维度生成模型:
句法与C-I接口的分野
潘俊楠、杜雨桥
香港中文大学
文章来源:https://www.degruyter.com/document/doi/10.1515/tlr-2024-2004/html
附加语结构(adjunction)对最简方案提出了挑战。最简方案假设,所有句法单位都必须被加标(label),否则无法被外部认知系统,特别是概念-意图系统(Conceptual-Intentional system; C-I)解算。然而,乔姆斯基(2013,2015,2020b)提出的加标算法(Labeling Algorithm;LA)无法处理附加语结构。附加语结构{α XP,YP}一般不允准XP或YP的移位,所以无法通过移出一个合并项(merge-mate)使得另一个合并项自动为α加标。修饰语与修饰对象之间往往不分享句法特征,因此也无法以共享的特征为α加标。如何处理附加语结构的加标算法,是最简方案的一个大问题。
本文基于附加语的特性,提出维度(dimension)作为语言的天然属性,句法单位可以是多维度的,一些语义解读依赖对多维度结构(multi-dimensional structures)的解读。其结果是,附加语结构的加标问题迎刃而解了。本文的理论优势主要有三点。首先,我们的理论以语言事实为出发点,不是为了解决附加语结构的加标问题而特设的。其次,对子合并(pair-Merge)不再是独立于集合合并(set-Merge)的句法操作,而是集合合并的一种情况。第三,多维度理论可以解释许多其他语言现象,例如连动句、并列结构等。
附加语结构的特点是语义上允准马尔可夫式解读(Markovian interpretation)1。如“活泼聪明的学生”,“活泼”与“聪明”各自平行独立地修饰“学生”,这类解读称为附加语结构的马尔可夫式解读。在句法上,这表示两个修饰成分之间不存在高低层级关系。如果附加语结构的基本句法结构为{α XP,YP},那么“活泼聪明的学生”需要被分析为三元的{α 活泼,聪明,学生},这违反了合并操作的严格二元性。乔姆斯基(2000,2004,2008)提出,附加语与句子主干处于不同的平面(plane),二者通过对子合并结合,得到有序对⟨XP,YP⟩,其中XP < YP;当多个修饰语被马尔可夫式解读时,各修饰语所在的平面互相独立,它们与修饰目标分别合并,得到多个互不干涉的有序对。这解释了附加语结构为什么允准马尔可夫式解读。另外,乔姆斯基假设修饰语在有序对中永远处于XP的位置,通过这种方式保证了修饰语永远弱于修饰对象,使得修饰语永远不可能为附加语结构加标,从而解决了加标算法的问题。对子合并假说的主要问题在于,对子合并与集合合并作为句法操作各自独立,这挑战了最简方案关于进化性与习得性的根本性假设,因此不符合强式最简命题(Strong Minimalist Thesis)的要求。另外,修饰语与修饰对象的区别是语义上的,作为句法操作的对子合并不应具有准确匹配其次序关系的能力,所以对加标问题的解法也不让人信服。
我们认同乔姆斯基附加语结构存在不同平面的假设,将“平面”正式命名为“维度”,并进一步提出,维度是任意句法单位α的基本属性。任何α都必然是n维的,n≥1;任何合并操作必须定义其输出结果β的维度结构,即对于{β X,Y},X与Y是处在同一维度还是两个维度。附加语结构就是当X与Y处于不同维度,即β是二维的句法单位时的一种情况;当存在多个平行维度的修饰语时,马尔可夫式解读就出现了。在这一模型下,集合合并是唯一的合并操作,不存在单独的对子合并。
我们提出,加标算法无法跨维度运算,在维度I内的加标算法无法获取维度II内的信息,因此对于一个二维的句法单位⟨β XI,YII⟩,维度I内的LAI只能看到X,从而自然地以X为β加标,而维度II内的LAII只能看到Y,因此以Y为β加标。在句法阶段,维度之间不存在主次之分,因此C-I系统会收到对β的两种加标方案,并自行选择其中可行的方案。也即,修饰语与修饰对象的主次之分只存在于C-I系统,在句法阶段并无此差别。
关于多维度模型,有三点需要说明。首先,维度是句法单位的基本属性,朴素集合论(Naïve Set Theory)2是对句法的一种抽象方式,不能因为朴素集合论不包含维度的概念而否定维度本身的存在。第二,维度不是工作空间(Workspace),也不是语段(phase)。工作空间是句法活动发生的场域,维度是句法单位的自有属性,二者无关。语段体现人脑工作记忆的有限性,但维度不体现有限性。第三,也是最重要的一点,多维度模型是在自由合并(free-merge)框架下提出的。自由合并框架认为句法操作是完全自由的,不需要为其生成结果对外部认知系统的可解读性负责,外部认知系统会排除不可解读的结果,解读可解读的结果。
我们首先以乔姆斯基(2021)的句子为例展示多维度模型的应用。
在(1a)中,副词carefully可以理解为从句中动词的情状副词,也可以理解为主句中动词的情状副词。以从句的情况为例。副词与VP从不同维度合并,合并操作的结果α为二维句法单位,C-I系统接收到两种加标方案,分别为(2)、(3)。C-I系统判断,α可以是VP,但不可能是AdvP,因此选取(2)而排除(3)。
在(1b)中,副词只能勉强理解为对整个主句的修饰,对应结构为(4)。虽然γ可以被加标为⟨φ,φ⟩,从而使得副词被理解为对⟨φ,φ⟩的修饰,但由于carefully本身词性的原因,这种修饰难以被C-I系统接受。
我们再以(5)为例,看如何用多维度模型得到马尔可夫式解读。在(5)中,man受happy与young修饰;一个形容词首先与名词合并,得到一个二维单位α,C-I系统判断α只能被理解为NP,而不能理解为AdjP。随后α与另一个形容词合并,得到二维单位β,β同样只能被理解为NP。由于两个形容词各自处在不同的维度,马尔可夫式解读是可能的。
图表2 马尔可夫式解读的多维度模型
多维度模型也可以解释包含多个附加语成分但非马尔可夫式解读的情况。以(6)为例,程度副词首先与情状副词合并,得到二维单位α,加标为AdvP,随后α与VP合并得到二维单位β,正确加标为VP。
多维度模型强调句法对可解读性的无知,可解读性是由外部认知系统判断的。以上例子讨论的是对一个二维单位α,仅有一种加标方案可解读时的情况。多维度模型预测,当外部认知系统判断对α的两种加标方案都可解读时,α具有歧义;当没有加标方案可解读时,α被判定非法。
以(7)的连动句为例说明歧义的情况。VP1与VP2合并,生成的结果α为二维的句法单位。加标算法在两个维度内各自运行,C-I系统得到两种加标方案,即分别以VP1与VP2加标。这两种方案都是可解读的。当α=VP1,VP2修饰VP1,意为张三会以使用筷子的方式吃饭。当α=VP2,VP1修饰VP2, 意为当吃饭时,张三会使用筷子。
以主语的例子来演示α无法被解读的情况。对于⟨α{NP 张三},{TP 喜欢句法}⟩,如果主语NP与TP合并得到二维的句法单位α,那么C-I系统将收到两种加标方案。然而,这两种方案都不合法,因为无论是NP还是TP,都不能理解为对方的修饰语。因此,α不能是二维的。正确的生成方法是,α是一维的句法单位,NP与TP处在同一维度,α通过共享的句法特征加标为⟨φ, φ⟩。
在对子合并假说中,乔姆斯基提出,有序对不支持移位,所以附加语构成对移位的孤岛。换言之,移位不能跨越维度。然而,语言事实表明维度不阻碍移位。显然,我们可以针对情状副词提问,如How did she run? --- She runs fast;此处,how就移出了原本占据的修饰语维度,进入了句子主干的维度。这表明维度不阻碍移位,因此,对附加语孤岛的解释不能简单归因于附加语结构的多维度性。
外部认知系统对于移位的解读主要是通过对移动的元素追加可解读关系来实现的。我们将可解读关系总结为三类,即论元关系(argumental relation),范围关系(scopal relation),修饰关系(modification relation),并且发现,只有范围关系可以被合法追加。
一些最简方案学者认为,附加语结构与并列结构在句法上是同构的。我们采纳这一假设,并提出它们的句法结构都是⟨γ α,β⟩,即γ是二维的句法单位。当α与β的标签相同时,C-I系统将γ理解为并列结构,否则理解为附加语结构。据此,上文例(7)的连动句应当被分析为并列结构。然而,对(7)更为自然的解读还是上文所述的两种修饰关系解读。我们提出,这是因为(7)中的“用筷子”“吃饭”两个事件联系紧密,因此与谈者会基于语用知识,使用修饰关系解读覆盖并列关系解读。这也反向说明了并列关系作为一种“初始假设”的脆弱性。当与谈者能够找到替代性解读时,就会倾向于覆盖掉原本的并列关系解读,因为并列关系在信息上常常不够丰富。
再举一例。NP“樱桃番茄”的结构为⟨α{NP樱桃},{NP番茄}⟩,是一个二维单位。由于两个NP标签相同,α应当被理解为并列结构,即樱桃和番茄。但是,也可以将其理解为一个修饰结构,即一种特定番茄的名称。
对中心语移位(head movement)的一种解释模型是基于对子合并的。如T移位到C,就是T与C对子合并得到复杂中心语⟨C,T⟩,其中C更为显著。前文提到,对子合并假说有一些问题,这种解法也有。多维度模型可以提供更好的解释。在(8b)中,T与C各自占据不同的维度,因此对于这个复杂中心语的“标签算法”,也有两种方案。C-I系统判断,此处需要C,而不是T,因此以C“加标”的方案被采纳。
注解
1 马尔可夫性质常见于概率论中的马尔可夫链(Markov chain),指一种随机过程,特点是“无记忆性”。此处对附加语的马尔可夫式解读的提法是Irurtzun与Gallego(2017)提出的,主要强调几个句法单位各自解读之间的“无记忆性”,与马尔可夫链是不同的概念。
2 朴素集合论是集合论的一种,区别于仅使用明确定义的公理列表构建的公理化集合论。它更贴近人对集合的自然理解,但无法规避逻辑悖论。见Halmos(1960)。我们认为最简方案对于集合论的使用没有到达公理化集合论的程度。虽然如此,乔姆斯基(2019)在其274页脚注27提到,对内合并操作的一种理解可以基于“更为泛化的策梅洛-弗兰克尔集合论(the more general framework of Zermelo-Fraenkel set theory)”。
部分参考文献
审校| 张庆文、程航、陈哲(广东外语外贸大学)
设计排版| 胡颜洁、陈观恩、罗晓君(广东外语外贸大学)
↙点击下方“阅读原文”跳转文章链接