任务复杂度对二语写作产出影响的元分析
吉林大学 申云化
奥克兰大学 ZHANG Jun Lawrence
吉林大学 孙琦玉
自20世纪80年代以来,在输入、输出和互动假说的影响下,任务型语言教学作为交际教学法的延伸,逐渐成为课堂二语习得领域的主流教学方法,学界进行了广泛深入的探讨,其中尤以任务复杂度对二语学习者语言产出流利度、准确度和复杂度的影响最受学者关注。相关研究主要基于“竞争假说”和“认知假说”两大理论观点,通过操控元素数量、推理需求和准备时间等任务复杂度变量,探究不同认知复杂度的二语任务与学习者语言产出质量之间的关系,以期为任务分级排序、任务设计以及制定任务教学大纲提供实证依据。然而,由于已有研究在任务类型、变量操控和产出测量指标等各方面存在差异,导致研究结果不尽相同,因此学界尚未就任务复杂度对二语产出的影响达成共识。元分析运用定量统计手段,整合分析同类研究的定量研究结果,全面客观地考虑抽样误差和无统计显著意义的结果,则能够有效解决同类研究结论的不一致性。元分析通过计算研究样本的总体效应大小,评估研究异质性,考察潜在调节因素对研究总体效应的影响,可以为理论验证和教学实践提供更加可靠的依据。本专栏收录的五篇文章采用元分析方法,系统梳理和分析了国内外有关二语任务的实证研究,希望能为任务型语言教学与研究提供理论指导和实践参考。
栏目主持人:Zhang Jun Lawrence @ UoA
摘要
01
引言
基于任务的语言教学(Task-based Language Teaching, TBLT)一直是二语习得领域的研究热点,而任务型教学的核心议题涉及任务选择(task selection)与任务排序(task sequencing)。任务复杂度(task complexity)概念的提出为解决上述问题提供了理论框架和可行路径。任务复杂度主要指“任务的内在认知复杂性”(Robinson 2011:14),它是“任务结构对语言学习者的注意力、记忆、推理以及其他信息加工资源所造成的认知负荷”(Robinson 2001:29)。任务复杂度一经提出便引起研究者的广泛关注。近年来,关于任务复杂度对二语写作产出复杂度、准确度和流利度的影响,研究数量在持续增长。然而,由于相关研究在研究设计、研究被试、任务类型、任务复杂度操控、以及语言产出测量指标等方面存在差异,研究结论并不完全一致(AbdiTabari & Hui 2024),因而有必要对已有研究进行全面梳理,整合任务复杂度的二语写作产出效应,为相关理论假说提供进一步的解释依据。鉴于此,本文基于“认知假说”的理论框架,采用元分析方法,探究任务复杂度对二语写作产出复杂度、准确度和流利度(CAF)的总体效应,并考察潜在影响因素的调节作用。
02
文献综述
2.1任务复杂度的相关理论
关于任务复杂度与二语产出的关系,影响最为广泛的理论观点当属Peter Skehan的“竞争假说”(trade-off hypothesis)和Peter Robinson的“认知假说”(cognition hypothesis)。Skehan (1998)认为人脑的注意力资源有限,认知要求高的任务会造成注意力资源竞争,学习者难以同时兼顾意义与形式,语言产出的复杂度、准确度和流利度之间彼此制衡。相反,Robinson (2001,2011)则表明,人脑在处理不同方式任务时具有多重资源池(resource pool),可以调配不同的认知资源来完成任务,因此语言产出维度之间并非一定彼此竞争。
“认知假说”将任务复杂度区分为资源指引(resource-directing)和资源消耗(resource-dispersing)两个维度,前者涉及任务元素数量(±few elements)、此时此地(±here and now),推理需求(±reasoning demands)等,而后者则包含先验知识(±prior knowledge)、准备时间(±planning time)和任务数量(±single task)等。Robinson(2001,2011)发现,如果沿资源指引维度增加任务复杂度,由于学习者需要刻意加工语言来满足任务的概念和功能需求,语言产出的准确度和复杂度会提高,但流利度下降;而沿资源消耗维度提高任务复杂度会消耗学习者的注意和记忆资源,导致流利度、准确度和复杂度均下降。需要指出的是,两种理论假说并非完全相悖(闫嵘、张磊2015;徐锦芬、陈聪2017)。例如,“认知假说”就资源消耗型任务复杂度对语言产出影响的预测与“竞争假说”一致,二者都认为增加任务复杂度会导致语言产出的复杂度、准确度和流利度下降。
2.2任务复杂度与二语写作
自两大假说提出以来,研究者在任务研究领域开展了大量有关二语口语产出的实证研究。随着研究不断深入,研究者开始关注任务复杂度对二语写作产出的影响(Ong&Zhang 2010;AbdiTabari&Hui 2024;王丽萍等2020)。这些研究多以资源指引或消耗维度上的某单一特征为变量,探讨任务复杂度对二语写作产出的影响。
首先,就资源指引维度而言,关于任务复杂度的研究主要集中在元素数量、推理需求、以及此时此地等变量对写作产出的影响,研究结果存在分歧。Tao&Wang (2022)和韩亚文、刘思(2019)均发现增加任务复杂度(如元素数量)会导致句法复杂度下降。杨颖莉、靳光洒(2023)则指出,随着任务复杂度的增加,学习者会优先关注写作产出内容,句法复杂度和准确度会有所提升,研究结论支持“认知假说”观点。然而,Xu etal. (2023)的研究却支持了“竞争假说”,后者认为增加任务复杂度会导致学习者二语写作的词汇复杂度下降。其次,在资源消耗维度方面,研究者主要关注准备时间、先验知识和任务数量等任务复杂度操控变量对二语写作表现的影响,相关研究亦无法达成共识(Ellis&Yuan 2004;Rahimi&Zhang 2019;刘兵等 2017)。Ong&Zhang (2010)的研究表明,提供写作准备时间反而对学习者二语写作产出的流利度和词汇复杂度产生消极影响。而在Rahimi&Zhang (2019)的研究中,如果沿资源消耗维度增加任务复杂度,学习者二语写作产出的句法复杂度和流利度会有所提升,但词汇复杂度和准确度却不受影响,该结果部分支持了两种理论假说。此外,研究者还将资源指引型和资源消耗型任务复杂度结合起来开展研究(如Ruiz-Funes, 2015;王丽萍 等 2020)。例如,王丽萍 等(2020)考察了元素数量和先验知识两个操控变量的二语写作产出效应,结果显示二者对学习者语言产出复杂度存在主效应和交互效应,并且对语言复杂度的不同维度产生不同影响。
综上,国内外研究表明复杂任务有助于促进二语写作学习者语言产出。但是,关于任务复杂度对学习者二语写作产出的具体影响,研究结论并不完全一致,一些研究部分支持“竞争假说”,而有些研究则部分证明了“认知假说”的观点。
2.3任务复杂度的相关元分析
鉴于相关实证研究结论上的差异,国内外学者就任务复杂度对二语产出的影响开展过一系列元分析(如Jackson & Suethanapornku 2013;Johnson2017;邢加新、罗少茜 2016),研究多以“认知假说”为理论框架,探究沿资源指引和资源消耗维度增加任务复杂度会如何影响二语产出的复杂度、准确度和流利度。其中,Jackson & Suethanapornkul (2013)是最早有关该议题的元分析。研究系统回顾了17项关于“认知假说”对口语产出预测的实证研究,结果表明增加任务复杂度对口语产出的流利度有消极影响,对词汇复杂度和准确度有积极影响,但均为小效应,对句法复杂度却没有显著影响。此后,邢加新、罗少茜(2016)对国内有关任务复杂度与语言产出关系的实证研究进行元分析,研究结果与Jackson & Suethanapornkul(2013)存在多处不一致。譬如,增加任务复杂度对中国英语学习者二语产出的句法复杂度有积极影响,且为中到大效应,对语言产出的准确度却产生小效应的消极影响。研究指出国内外实证研究在操控变量和产出测量指标上存在差异,可能是导致元分析结果不一致的主要原因。与此同时,邢加新、罗少茜 (2016)还对比了口语和书面语两种产出模态对任务复杂度效应的影响,结果显示产出方式仅对任务复杂度在语言产出流利度的效应上影响显著,而在句法复杂度、准确度和词汇复杂度方面则无显著影响,该分析结果部分支持了Skehan的“竞争假说”。截至目前,国内外聚焦任务复杂度对二语写作产出影响的元分析仅有Johnson (2017)、李玖、王建华(2017)和Johnson&AbdiTabari (2023)三项研究。Johnson (2017)在归纳主要任务复杂度操控变量类型和二语写作复杂度、准确度和流利度测量指标之余,还就国外20项研究进行元分析,发现组间研究设计的元分析结果部分支持“认知假说”,沿资源指引维度增加任务复杂度,对二语写作产出的准确度和复杂度产生小到中等效应的积极影响,而组内研究设计的元分析结果却支持“竞争假说”,增加任务的推理需求会导致复杂度、流利度和准确度之间相互竞争;沿资源消耗维度降低任务复杂度对二语写作产出的准确度、复杂度和流利度则有小到中等效应的积极影响,这与“认知假说”关于任务复杂度对二语写作产出的预测效应一致。此后,李玖、王建华(2017)从20项国内外相关研究中提取了41个独立样本进行元分析,结果表明相关研究以单因素和资源指引型任务复杂度为主,资源指引型任务复杂度对二语写作的复杂度和流利度具有显著的积极效应,但对准确度效应不显著;资源消耗型任务复杂度对准确度有消极效应,但对句法复杂度的消极效应不显著。在最近的一项研究中,Johnson & AbdiTabari (2023)对资源消耗型任务复杂度变量准备时间的相关研究进行元分析。研究结果显示,任务前准备(pre-task planning)对二语写作产出的准确度有小效应的积极影响,对句法复杂度和流利度有小到中等效应的积极影响,但对词汇复杂度的影响很小;而在线准备(online planning)仅对准确度具有小效应的积极影响,而对其他产出测量指标则无显著影响。纵观已有元分析,多以二语口语产出研究和资源指引型任务复杂度研究为样本,纳入分析的文献数量较少,并多发表于2017年以前,元分析的研究结论并不完全一致。尽管Johnson & Abdi Tabari (2023)纳入了近年的新增文献,但研究只关注准备时间对二语写作产出的影响,并未考察其他资源消耗型任务复杂度变量的效应。基于以上文献综述的结果,本研究将进一步整合分析任务复杂度的二语写作产出效应,旨在回答下列研究问题:1)任务复杂度对二语写作产出的句法复杂度、准确度、词汇复杂度和流利度的总体效应如何?2)任务复杂度的研究中,研究设计、研究语境、二语语种及二语水平等因素是否对其二语写作效应具有调节作用?
03
研究方法
3.1文献检索
为全面、精准地检索相关文献,本研究采取数据库自动检索和人工检索策略。首先,1)在Web of Science核心数据集中,使用布尔逻辑检索式TS=((task complexity OR task difficulty OR cognition hypothesis OR trade-off hypothesis OR limited attention capacity model)AND(syntactic complexity OR lexical complexity OR fluency OR accuracy)AND(L2 writ*OR EFL writ* OR ESL writ* OR writ*task OR writ* production))检索;2)在Scopus数据库中,使用检索式TITLE-ABSKEY(“task complexity” OR “task difficulty ” OR “cognition hypothesis” OR “trade off hypothesis” OR “limited attention capacity model”) AND (“syntactic complexity” OR “lexical complexity” OR “fluency” OR “accuracy”)AND(“L2writ*” OR “EFL writ*” OR “ESL writ*” OR “writ*task” OR “writ*production”)检索,将检索结果导出至endnote软件进行查重和摘要阅读。其次,在CNKI数据库中,使用关键词“任务复杂度”、“任务准备”、“二语写作”、“外语写作”、“英语写作”和“书面语产出”等关键词检索。最后,根据已有研究(如Johnson 2017;Johnson & Abdi Tabari 2023)的参考文献列表进行人工筛查,查缺补漏。通过以上检索策略,最终检索到中、英文论文140篇。
3.2文献筛选
文献筛选标准如下:1)必须是围绕任务复杂度对二语写作产出影响的实证研究;2)自变量必须是依据Robinson (2001)的任务复杂度分类框架,沿资源指引型维度和资源消耗型维度划分;3)因变量必须至少包含句法复杂度、准确度、词汇复杂度或流利度的一项测量指标;4)被试必须是二语或外语学习者;5)必须是组间或组内比较的实验研究设计;6)必须是以中英文发表的北大核心、CSSCI、SSCI来源期刊论文;7)必须包含计算效应量所需的统计信息。经筛选,剔除不符合上述标准的原始研究,最终纳入中、英文文献总计51篇,涉及被试总人数4632人。
3.3文献编码
本研究使用Excel表格对纳入研究的文献特征、方法特征和内容特征等进行编码。部分研究考察多项任务复杂度变量(如Golparvar&Azizsahra 2023)、不同程度的任务复杂度(如Abdi Tabari 2022)、以及任务复杂度对不同个体差异水平被试的写作产出效应(如闫嵘、张磊 2015),我们将每次均值比较按照独立样本处理;对于2×2的交叉因素(如Tao&Wang 2022)或前后测实验研究设计(如Fukunaga 2023),则选取无干扰变量组的均值比较作为独立样本,最终从纳入研究的文献中提取88个独立样本。我们从纳入研究的文献中抽取12篇(约20%),两名应用语言学专业研究生接受培训后,依据预先制定的编码表,对文献特征(作者、出版年、样本量、二语语种、研究语境),方法特征(研究设计、写作任务类型、任务复杂度类型),和内容特征(产出测量指标、测量指标的均值、标准差、其他可以计算效应量的统计信息)进行编码。除研究设计(组间比较vs.组内比较)的编码一致性系数(Cohen’s Kappa)为0.75外,其余变量的编码一致性系数均在0.90-1.00之间。随后,我们协商解决编码分歧,共同完成剩余样本的编码。
3.4数据分析
我们首先利用纳入研究的均值、标准差和样本量,通过网站计算器(https://www.campbellcollaboration.org/research-resources/effect-size-calculator.html)计算效应量d值,对未报告以上统计信息的研究,则利用t值或F值计算效应量(如Rahimi&Zhang 2018)。对于同一变量采用多个测量指标的研究,我们先分别计算效应量,再将其合并为一个综合效应量值进行元分析。因为部分研究采用无错T单位比和T单位错误比(如靳红玉、王同顺2021)或每分钟音节数和非流利度(如Ellis&Yuan, 2004)等明显含义相反的测量指标,计算时进行数值逆转换。最终,我们从样本中提取280个效应量,使用SPSS转换成标准值Z,将其绝对值大于2的效应量视作异常值剔除(Li 2010),然后将效应量值、置信区间和样本量录入Comprehensive Meta-Analysis(3.0)软件,进行发表偏倚检验、异质性检验、效应量合并和调节变量分析。由于纳入分析的文献在研究工具和研究设计上存在差异,故而选择随机效应模型作为效应量评估模型。本研究按照Cohen(1998)的衡量标准判断效应量大小,分别以0.2、0.5和0.8定义小、中、大效应。
04
研究结果与讨论
4.1发表偏倚检验
本研究通过观察漏斗图检验发表偏倚,效应量并非完全对称地分布在漏斗图两侧,可能存在发表偏倚影响。失败安全系数(Fail-SafeN)显示分别需要146和238项缺失研究可以推翻句法复杂度和准确度的显著性结果,低于Rosenthal(1991)5k+10的数量。但是,Begg&Manzumdar秩相关检验表明,发表偏倚对句法复杂度(p=0.647)、准确度(p=0.601)、词汇复杂度(p=0.916)和流利度(p=0.296)的效应评估威胁不严重,元分析结果可靠。
4.2异质性检验
如表1所示,异质性检验结果显示各独立样本之间存在不同程度的异质性。其中,按照I2值25%、50%、75%对应低、中、高异质性的判断标准(Higgins etal.,2003),句法复杂度和准确度的总体效应量存在高度异质性,词汇复杂度和流利度总体效应量则存在中等程度的异质性,说明纳入分析的研究效应可能受到调节变量的影响,有必要采用随机效应模型进行效应量评估和调节效应检验。
4.3任务复杂度对二语写作产出的影响
表2概括了任务复杂度对二语写作复杂度、准确度和流利度的总体效应。结果发现,一方面任务复杂度对二语写作句法复杂度(d=0.070)、词汇复杂度(d=0.037)具有积极效应,但只有句法复杂度效应显著,95%置信区间不包含零。Yoon&Polio(2017)发现即使同一作者完成不同体裁的写作任务,其词汇复杂度也会有所差异,因此任务复杂度对二语写作词汇复杂度效应的变异性较大,可能致使元分析结果不显著。另一方面,任务复杂度对准确度(d=-0.096)和流利度(d=-0.008)具有消极效应,并且只有准确度效应显著,95%置信区间不包含零,该结果与邢加新、罗少茜(2016)的元分析结果基本一致,后者发现在剔除可能异常值后,任务复杂度对流利度产生负面效应。研究结果部分支持“认知假说”关于任务复杂度对语言产出效应的预测,增加任务复杂度能够促使学习者更加关注语言产出的形式,进而提高写作产出的复杂度,却导致流利度降低。另外,由于学习者在写作任务中往往拥有较多的构思时间,会刻意将认知资源分配到词汇选择和句法形态加工上,而且又因为复杂度和准确度相互制约(RuizFunes2015;李玖、王建华2017),所以语言错误增多,准确度下降。就本质而言,该结果也体现了“竞争假说”的理论观点,学习者受制于有限的注意力资源和工作记忆容量,语言产出的复杂度、流利度和准确度之间存在互相制衡的关系。
由表3可知,资源指引型和资源消耗型任务复杂度对二语写作产出存在不同影响,前者对句法复杂度、词汇复杂度和流利度均有积极效应,而后者则具有消极效应。首先,沿资源指引维度增加任务复杂度可以显著提升句法复杂度(p=0.017)和词汇复杂度(p=0.033),但却降低准确度,效应量均属于小效应。该结果与Johnson (2017)的研究结果基本一致,结果表明增加任务复杂度会导致复杂度与准确度之间的竞争,符合“竞争假说”的对任务复杂度效应的预测(Skehan 2009)。例如,Johnson(2017)认为增加任务推理需求能够激活工作记忆的语音回路成分,促使学习者提取复杂词汇来满足写作任务的要求,但与此同时,更多注意力资源从监测系统转向翻译过程,导致产出准确度下降。值得注意的是,本研究流利度的合并效应量接近于零(d=0.003),与邢加新、罗少茜(2016)的研究结果一致,他们发现在剔除可能异常值后,增加任务复杂度对流利度产生微弱的负面效应(d=-0.01),但李玖、王建华(2017)的元分析却发现增加任务复杂度可以显著提升流利度(d=0.22),一个可能的原因是后者研究样本的异质性不高(I2=38%),并且积极效应量居多。其次,沿资源消耗维度增加任务复杂度则导致词汇复杂度、句法复杂度、准确度和流利度不同程度的下降,但95%置信区间包含零,表明效应不显著,而且均为小效应。该结果与Johnson(2017)和Johnson & Abdi Tabari (2023)的研究结果基本一致,表明任务教学中通过提供任务准备时间、背景知识或任务结构来控制复杂度,可以有效降低写作任务的认知负荷,提升二语写作各个维度的表现。但该结果与李玖、王建华(2017)的研究发现存在相悖之处,后者发现沿资源消耗维度增加任务复杂度可以提高流利度和词汇复杂度。这种差异可能源自于资源消耗型任务复杂度的自身特性。Robinson (2011)认为,资源消耗型任务复杂度对认知提出表现性和程序性需求,分散认知资源,从而可能导致学习者关注非语言因素,忽视语言的编码过程,导致语言产出的复杂度、准确度和流利度降低。需要指出的是,本研究的合并效应量与以往同主题元分析相比较小。究其原因,本研究除纳入以准备时间作为任务复杂度操控变量的实证研究以外,还纳入了以先验知识(如Tao&Wang 2022)和任务结构(如Zhang 2024)为操控变量的研究。而且,本研究样本量大,研究对象和语境广泛,有可能出现正负效应相互抵消,此外本研究还排除了如Ellis&Yuan (2004)的句法复杂度效应(d=-1.302)和准确度效应(d=-1.253;d=-1.717)等异常值,这些因素都可能导致合并效应量偏小。
4.4调节效应检验
本研究对研究设计、研究语境、二语语种和二语水平等潜在调节变量进行亚组分析。调节效应检验显示,研究设计和研究语境对任务复杂度的二语写作效应无显著调节作用,两种调节因素下的元分析合并效应都部分支持“竞争假说”观点,增加任务复杂度会提高语言产出复杂度,但却降低准确度和流利度。学习者的二语水平只对二语写作准确度具有显著调节效应(Q=12.019,p=0.017)。与高级水平学习者相比(d=-0.05),任务复杂度对中级(d=-0.116)、中高级水平学习者(d=-0.119)的写作准确度负面效应更大,这可能是因为高级水平学习者的二语自动化程度较高,能够弥补因任务复杂度增加而产生的认知负荷,从而确保了二语写作产出的准确度;相反,中级和中高级语言学习者语言能力正处于发展阶段,学习动机和需求较强,在面对复杂任务时会尝试更多词汇形式和句法形态变化,因而导致语言错误增多(李玖、王建华2017)。亚组分析还发现,二语语种是任务复杂度对二语写作句法复杂度(Q=23.175,p<0.001)、准确度(Q=35.141,p<0.001)和流利度(Q=16.129,p=0.001)效应的显著调节变量,这可能与不同语言的词汇语法和句法形态差异、以及母语和二语之间的语言距离有关。例如,同样是美国高校外语学习者,Abrams&Byrd (2016)中任务复杂度的德语产出流利度效应(d=0.767)就远大于Fukunaga (2023)日语产出流利度效应(d=-0191);而对Kuiken & Vedder (2007,2008)的荷兰学习者而言,增加任务复杂度对意大利语产出的词汇复杂度有积极效应(d=0.189),但对法语产出的词汇复杂度却有消极效应(d=-0.069)。该结果与Watzinger-Tharp etal.(2018)的发现一致,该研究对美国双语沉浸式教学项目开展全国性调查评估,发现不同语种的学习成效和发展模式存在差异。但本元分析样本中受试的二语仍以英语为主(41篇),其他语种的文献数量有限,因此该结果的解读需要谨慎,还需要更多实证研究加以验证。
05
结语
本研究就国内外51项关于任务复杂度对二语写作产出效应的原始研究进行元分析,研究结果显示,任务复杂度对二语写作复杂度有积极效应,对流利度和准确度则有消极效应。具体而言,沿资源指引维度增加任务复杂度,二语写作复杂度和流利度会获得提升,但准确度却有所下降,部分证实了“认知假说”关于任务复杂度对二语写作效应的预测;而沿资源消耗维度增加任务复杂度,对二语写作产出的各维度指标均产生负面影响,验证了“认知假说”和“竞争假说”的共同观点,即降低复杂度可以提升二语写作复杂度、准确度和流利度。调节变量分析表明,二语语种和二语水平是二语写作任务复杂度效应的显著调节变量,而研究设计和研究语境则不具有显著调节作用。本研究发现对于任务型写作教学的实施具有借鉴参考价值,可以帮助教师制定任务型写作教学大纲,针对学习者的写作能力发展需求,合理有序地安排不同复杂度的写作任务,从而优化学习者语言产出的复杂度、准确度和流利度。
本研究仍存在一定局限性。首先,为保证样本研究的质量,本文仅纳入北大核心、CSSCI和SSCI来源期刊论文,因此元分析样本可能存在一定程度的发表偏倚。未来研究可以放宽文献纳入标准,将国内外博士论文、书籍章节和会议论文纳入分析,从而最大程度减少发表偏倚对元分析结果的影响。其次,未就“认知假说”关于任务复杂度的具体操控变量进行编码,无法精准评估元素数量或准备时间等操控变量对二语写作产出的影响。未来研究可以整合分析不同任务复杂度操控变量对二语写作的效应,从而为写作任务设计和课堂任务排序提供更加详细具体的参考。
编者按
参考文献略,欢迎查阅知网或《现代外语》2025年第1期纸质原文。
本文编辑:孙雨 同济大学
郑重声明:本公众号推送的文章不能代表本公众号立场。本公众号推送的学术会议、博士招生不负责对接解释。有任何疑问请按照推送内容的官方联系方式对接!如果学术会议、博士招生有任何官方调整,责任不在我方。我们优先推广免费的学术会议、讲座、研修等项目。
语言治理
欢迎关注
Language Governance Alliance
球分享
球点赞
球在看