张义宾，戴熙玉，郭少阳，周兢：汉语儿童语言发展评估的进展与思考

学术 2024-08-13 17:01 北京

2024年第4期

专题研究二　儿童语言

张义宾

华东师范大学副研究员，主要研究方向为儿童语言发展

郭少阳

华东师范大学博士后，主要研究方向为智能化教育测评

戴熙玉

常州工学院讲师，主要研究方向为儿童语言发展与教育

周兢

华东师范大学教授，主要研究方向为儿童语言发展与教育

汉语儿童语言发展评估的进展与思考

张义宾¹，戴熙玉²，郭少阳³，周兢⁴

（1.华东师范大学　脑科学与教育创新研究院　上海　200062；2.常州工学院　师范学院学前教育系　江苏　常州　213032；3.华东师范大学　上海智能教育研究院　上海　200062；4.华东师范大学　教育学部学前教育学系　上海　200062）

提要 汉语儿童语言发展评估仍处于起步阶段，近年来呈现出3个主要特征：初步建立起以标准化评估和非标准化评估为主要范式的多样化评估框架；评估对象从单一模态走向多模态融合；评估技术从传统迈向人工智能。但与国际研究相比，尚存以下问题：语言学发挥的作用不大，极易导致评估走向某种偏颇；本土化评估体系亟待建设；相关数据库还比较匮乏。基于此，有针对性地提出建立中国特色汉语儿童语言发展评估体系的3点建议：建立“为儿童而研究儿童语言”的儿童语言学科，发展相关课程与教材，并加强跨学科教学团队建设；转变西式思维，加强汉语儿童语言评估系统的自主研发；拥抱数字时代，建立可共享的汉语儿童语言发展数据库平台。

关键词 儿童语言；评估；汉语

一、问题提出

自陈鹤琴系统记录和观察儿童言语发展过程，探讨儿童语言教育之路开始，中国儿童语言研究至今已有百年之久。从探索汉语儿童的语言习得规律，到研究儿童语言能力与发展环境的关系，汉语儿童语言研究为中国汉语儿童的语言学习、发展和教育提供了大量的学理支持，推动儿童语言教育不断深入和扩展。作为儿童语言研究十分重要的一个板块，儿童语言发展评估吸引了包括心理学、语言学、教育学、临床医学等交叉领域研究人员和一线工作者，甚至是普通家长的关注。由于儿童早期的语言能力与其后来的学业成就、社会情感、心智和身体发展都是密切关联的（McCabe & Meller 2004；李宇明2022），所以不论是在国家通用语言质量监测，还是在特殊儿童发展筛查、诊断与评估中，语言能力都作为重要的指标受到普遍关注（周兢，等2018；陈敏倩，等2009；刘焱，等2012）。

尽管中国儿童语言研究已历时百年，但对儿童语言发展评估的研究仍处于起步阶段，及时回顾和描述当前国内外研究者对境内汉语儿童语言发展评估的研究状况，并展望汉语儿童语言发展评估的未来，对于促进这一领域的研究与实践具有重要的价值。

二、汉语儿童语言发展评估现状

近年来，随着儿童语言研究受到研究者的普遍关注，相关评估框架和内容的开发也提上日程，不少研究团队开展了有益的探索。在中国，有关汉语儿童语言发展的评估呈现出多样化取向、多模态取向和人工智能取向3个主要特征。

（一）初步建立起以标准化评估与非标准化评估为主要范式的多样化评估体系

随着儿童语言研究的推进，中国已经初步建立起以标准化评估和非标准化评估为主要范式的多样化评估框架，又以前者的使用最为普遍。标准化评估是一种使用相同年龄儿童的常模参考数据对目标儿童进行评估的方式，能够比较便捷地评估出目标儿童现有的语言发展水平，并初步筛查出语言发展障碍儿童。其中最常见的评估范畴是词汇、语义和语法，主要覆盖两种语言形式，即表达和理解。在现有汉语儿童语言评估中，标准化评估主要包括两个大类：其一是在儿童综合发育评估中所涉及的语言评估部分，其二是专门针对儿童语言的专项评估工具。前者涉及的综合类发展评估包括《格塞尔儿童发育量表》《儿童发展与行为评估量表》《丹佛发育筛查评量表》《幼儿/儿童韦氏智力测试》《年龄–发育进程问卷》《亚太地区早期儿童发展量表》等，后者则包括《汉语版沟通发展量表》《语言发育测试评估S-S法》和《理解性词汇发展评估》（PPVT-R）、《表达性词汇发展评估》（EVT-R）、《梦想普通话听力理解和表达能力标准化评估》（DREAM-C）（Liu et al. 2017）、《汉语语言发育评估量表（语法篇）》（张显达，等2022）、《2～6岁儿童语言发育评估量表》、语言认知评估系统（周钰，等2022）、《2～6岁儿童沟通功能量表》（陈思齐，等2022）等。此外，在国家通用语言文字方面，还出现了针对少数民族学前幼儿汉语能力的测试工具（李瑞华，陈诗琪2022）。可以说，上述标准化评估工具的开发与运用，推动中国从引进西方标准化评估逐步迈向评估的自主化，构建起了中国早期儿童标准化的语言科学评估体系，大大改变了中国儿童语言发展评估以及语言障碍儿童诊断领域缺乏工具的局面。

与标准化评估方式相对应的是以语料库为基础的非标准化语言评估。作为国际相关领域评估的“金标准”，语料库分析一直是语言学关注的焦点，近年来逐步扩展到汉语儿童语言领域。一方面，以汉语儿童语料库为基础建立起了语言障碍诊断体系，覆盖了词汇和语法发展两大范畴，以词汇多样性和不同词汇产出作为词汇评估内容，以平均语句长度、最长5句话的平均语句长度以及不同语法结构产出作为语法评估内容，为诊断语言障碍儿童提供了新思路和新选择，可以为诊断和干预发展性语言障碍、自闭症、听力障碍以及智力障碍儿童提供补充性证据（Zhang & Zhou 2020；周兢，张义宾2020a，2020b）；另一方面，基于言语数据，从语音、能产性、流畅度、语法、语义以及逻辑六大语言维度出发，构架了汉语儿童言语交际水平评估系统，可以为语言发展评估和语言障碍儿童筛查提供必要的证据（陆烁，等2021）。

（二）语言发展评估的对象从单一模态走向多模态融合

语言学研究表明，语言在本质上是多模态的，在交际中除了语言之外，人们还会使用发音、手势、面部表情/情绪等身体语言和副语言（Levinson & Holler 2014；黄立鹤，张德禄2019）。事实上，这种多模态属性在儿童早期就已经显现（Morgenstern 2014）。儿童早期的交际行为首先通过手势、面部表情和注视来实现，然后才逐步发展到语音和其他符号系统。语言模态与非语言模态的有效协调在儿童语言理解和语言表达中发挥着重要的作用。这种多模态视域下的儿童语言发展观，也进一步推动了汉语儿童语言发展评估的多模态转型。

一方面，对儿童语言发展评估的研究，从单纯关注儿童的产出性言语（以词汇和句法复杂度为主），逐步扩展到其他语言模态。其中较多的研究与人工智能和自然语言处理相结合，关注到儿童的语音发展范畴，重点分析言语特征（停顿、言语流畅度、重复等）对于区分正常儿童和发展异常群体的有效性（Kuo et al. 2022）。国内研究团队也融合语音、能产性、流畅度、语法、语义以及逻辑等模态数据，设计开发了儿童语言障碍精准诊断系统（陆烁，等2021）。另一方面，有关的儿童语言发展评估从传统的语言模态向非语言模态转变，开始关注身体语言（手势、眼动、面部表情和姿势等）和非语言领域（如认知数据、脑电数据、基因数据等）（孙永兵，等2022）。比如廖梦怡等（2021）设计自闭症儿童智能化识别方法时，在考察眼动和面部表情等身体语言的同时，也融入了认知得分和认知反应的数据，这大大扩展了有关儿童语言评估的范畴。多模态数据（认知、行为和语言）的融合，不仅可以为探寻语言障碍儿童的语言交流提供更为精细的尺度，而且为绘制语言障碍儿童的发展轨迹和个体差异提供了新的视角，有效弥补了过往传统评估耗时耗力、评估工具匮乏且易受评估人员专业知识能力影响的不足。需要进一步关注的是，计算机分析技术的进步成为推动儿童语言发展评估走向多模态的重要手段，比如有关多模态语料库建立的技术，国际儿童语料库系统CHILDES从单纯转录语音，到目前已经发展到可以实现视频资料的实时编码和转录；有关儿童模态数据的采集从传统行为、录音等转向视频、眼动仪、功能性脑磁共振呈现等，都为展现和分析儿童的模态数据提供了基础。

（三）语言发展评估技术从传统迈向人工智能

数字技术和计算机科学的进步正在引领我们走向一个技术社会，在这个社会中，机器的设计和开发逐步满足人类的需求，同时变得更加智能。在儿童语言发展评估中，以数字化触控技术为核心的测试技术逐步取代传统的纸笔测试。测试过程融入声音、图像、视频等多种元素，以儿童能理解的方式准确地呈现测试内容，增进了评估的趣味性，大大提高了测试的吸引力。而在测试形式上，以自适应和自然语言加工为特征的测试逐步取代单纯的年龄–发展评估，人工智能技术正在以一种持续发展的态势赋能这一领域。

自然语言处理技术的进步，一方面使得自动化分析儿童日常语音数据成为可能，比如语言环境分析系统LENA（Xu et al. 2009），利用可穿戴的录音设备和成熟的自然语音处理技术，实现了对儿童家庭语言环境的自动化分析，揭示了汉语家庭中成人话轮、词汇量与儿童词汇发展的关系。另一方面，将传统的分析维度进一步扩展和融合，比如基于国际儿童语料库系统CHILDES开发的中文KidEval系统，可以实现对20多个汉语儿童语言发展指标的自动化分析，覆盖了语言产出的总词数、不同词数、总语句数、平均语句长度等分析指标；而基于语音识别的计算机辅助语言评估，可以实现对构音、口吃、词汇、语言表达方面的评估，大大提升了研究的效率。值得一提的是，上述自动化分析系统在有关汉语特殊儿童语言评估和诊断研究中同样开展了有益的探索。

国际研究对研究工具的分析发现，受儿童语言发展个体差异的影响，临床使用的很多筛查工具并不足以识别语言发展困难儿童（Law et al. 1998）。由于多数语言障碍儿童群体的产出性言语较少，难以达到词汇和句法产出复杂度的分析标准，影响了语言发育诊断，因此不少研究者开始探索运用其他人工智能辅助进行分析。其中最为突出的特征是，采用机器学习和分类模型对不同数据进行融合分析，比如廖梦怡等（2021）对自闭症儿童眼动、面部表情和认知数据的融合分析，李欢、曾硕（2022）综述中提到的卷积神经网络方法等，都反映了儿童语言发展评估的智能化转向。

三、汉语儿童语言发展评估的问题和解决路径

尽管中国汉语儿童语言发展评估呈现出方式多样化、对象多模态化和测试人工智能化的倾向，但是我们不得不正视，这些发展与国际相关领域研究相比，尚存较大差距。认清当下中国儿童语言发展和语言发展评估领域存在的重要问题，并有针对性地切实解决，是建立中国特色汉语儿童语言发展评估体系的重要路径。

（一）突破传统学科规约，建立大“儿童语言”学科体系

总结当下的汉语儿童语言发展评估，我们发现，开展儿童语言发展评估最多的领域是教育学和心理学，其次是临床医学。尽管语言学也参与其中，但是其学科的引领作用不够突出，与其他学科的交叉不足，使得教育、心理和临床应用中缺乏语言学理论支撑，极易造成汉语儿童语言发展评估的偏颇。

要解决目前汉语儿童语言发展评估的问题，就要解决汉语儿童语言研究人才培养的问题。首先需开设儿童语言相关专业学科。检索以儿童语言为主题的硕博士学位论文，我们发现，相关研究主要来自中国语言文字（33%）、学前教育（18%）、成人与特殊教育（14%）、外国语言文学（11%）以及儿科学（8%）等学科，其中中国语言文字学科最多，但是实际开展儿童语言发展评估最多的领域是教育学和心理学，学科培养和实际应用之间差距明显。而单就学科培养来看，目前并没有专门针对儿童语言的学科建制，所以建立真正“为儿童而研究儿童语言”（李宇明2021）的儿童语言学显得十分必要。其次，目前国内专门开设儿童语言方向课程的高校并不多，相关知识的教学一般分散在儿童心理学、学前儿童语言教育以及心理语言学等课程里，相关教材也比较匮乏。为了让学生可以接触到儿童语言研究领域最新的系统理论、方法、实践等内容，高质量的课程和教材研发迫在眉睫，特别是针对特定的儿童语言评估领域，应尽快开发相关的语言学、测量学、言语听觉科学、康复科学等多领域课程和教材。最后，儿童语言发展评估属于横跨多门学科的交叉学科，因此需要突破传统学科体系，在专业建设和学生培养中加强跨学科教学团队建设，融合认知科学、发展心理学、神经科学、计算机科学、医学、康复科学等学科，助力儿童语言评估领域人才的培养。

（二）转变西式思维，加强汉语儿童语言评估系统的自主研发

中国儿童语言研究中汉语儿童语言评估板块起步较晚，有关儿童语言发展评估的研究体系尚未完全搭建，需要在借鉴国际优势评估研究的基础上，促进本土化的评估体系建设。在借鉴的过程中，大量测试工具、测试形式、内容和模型的引入，特别是利用翻译和常模建构，丰富中国儿童语言发展评估实践，使得中国目前的儿童语言发展评估呈现出多样化的特点。在这一过程中，研究者也认识到，以西方儿童语言发展研究为基础的语言发展评估工具，并不完全适用于汉语儿童，比如相关研究发现，中国学前儿童的词汇理解水平要略低于表达性水平（周兢，等2017），在衡量语言障碍儿童干预效果方面，不同工具之间存在着极大的异质性（张义宾，等2016）。因此，自主开发适合中国语言文化特质的儿童语言评估系统，具有重要意义。这一点，还有很长的路要走。

自主开发汉语儿童语言发展评估系统，需要回应“儿童语言发展到底评估什么”以及“怎么样评估儿童语言发展”两大问题。从语言学角度出发来看，语言是一个复杂的动态系统，包括语音、词汇、语义、语法、语用和话语等。单一语言维度的测试不足以确定儿童语言的真实水平，而且儿童年龄越小，其可靠性就越低，这在学龄前阶段尤其值得关注。比如很多研究使用词汇量度作为语言能力的唯一指标（Dockrell 2001；Dockrell & Marshall 2015），但是不少学龄前儿童尽管已经拥有了足够的词汇量，却仍然存在语义和语法问题（Gray et al. 1999）。因此，除现有工具所关注到的语音、语义、语法、语用等不同范畴之外，还应该开展有关身体语言（如手势、面部表情、姿态、头动等）的探索性研究，并结合非语言范畴（如传统认知、社会交际行为）的模态，建立汉语儿童多模态评估的相关理论模型。就评估方式来看，目前常用儿童语言发展评估工具多是纸笔测试，以传统的年龄–发展评估为主，无法对儿童的能力下限和上限做出准确评估，常出现“天花板效应”和“地板效应”。近年来，自适应技术成为影响该领域发展的重要理论模型。基于项目反应理论垂直等值设计题库，不仅避免了传统固定测验的年龄制约，可以根据儿童的作答过程动态评估儿童的能力，从而减少测验题量、提高测验效率。更为重要的是，自适应技术可以有效避免传统固定测验的题目曝光问题，能够用不同的题目对儿童进行重复测量。此外，国际研究已经将自然语言加工、机器学习、深度学习等人工智能技术渗透到该领域中，这些有益的探索仍然需要在汉语儿童语言发展评估系统的开发中予以验证。比如华东师范大学脑科学与教育创新研究院开展的丽娃语言评估项目，从词汇理解、词汇表达和识字能力3个角度出发，融合自适应技术开展了有益探索。在这一领域仍然需要进一步扩展。

（三）拥抱数字时代，建立可共享的汉语儿童语言发展数据库平台

儿童语言评估的核心在于数据，这些数据不仅包括量化数据，还包括质性数据。传统的标准化评估后所建立的儿童语言发展常模、基于非标准化手段（如语料库）所建立的儿童语言发展参考数据集等，都是儿童语言发展评估中十分宝贵的数据库。尽管有学者呼吁建立开放共享且具有学术辐射作用的汉语儿童语料库，为研究中国家庭儿童语言发展提供数据参考（贾红霞，李宇明2022），但是目前相关数据库还比较匮乏。到目前为止，国内最具有代表性的是华东师范大学儿童语言研究中心建立的汉语儿童语言数据库。该数据系统以语料库建设作为核心，已囊括了中国不同省市儿童语言的数据近60 000分钟，同时收集大中华文化情境中儿童华语学习与发展的语料数据，比如新加坡、马来西亚华语儿童语言发展的语料均有储存。但相对于2.5亿儿童来说，这一数据量级显然不成比例，不具常模参考价值。

因此，汉语儿童语言研究数据平台的建设还需要进一步努力，不仅需要依托现有的工具或者开发新工具广泛采集不同群体儿童的语言发展数据，还需要加强相关的汉语儿童语料库建设。第一，建立不同儿童群体的数据库系统，比如正常儿童和自闭症、听力障碍、多动症、阅读障碍儿童等；数据体系需覆盖口头和书面语料，需结合任务驱动和日常语言接触进行语料采集，技术层面上则需要建立基于儿童语言特征的自动化分析系统。第二，建立语音发展数据库，提升儿童语音自动识别能力。尽管自然语言加工技术在汉语中得到了广泛的应用，但是对儿童群体语言的研究中仍然缺乏足够大量的参考数据集，特别是在语音识别领域，识别率低的问题尚未解决，这会制约自动化和智能化的语言发展评估的编制，未来还需要加强这一领域的数据库建设和语音大数据积累。第三，打通应用场景，从实验室为主、任务驱动的儿童语言发展评估，向日常语言使用评估转向。智能化发展推动了语言数据采集技术的发展，使采集一日生活场景下的儿向语和儿童语言数据成为可能，比如LENA可以实现连续16个小时的数据采集，而现有的录音和录像设备也可以采集更长时间的数据，这都有利于汉语儿童语言发展数据库平台的建设与推进。

儿童语言的秘密，是童年的秘密。对儿童语言发展的评估，是开启童年秘密的一把钥匙。语言评估不仅揭示了汉语儿童语言发展的规律，也为推动汉语儿童的语言学习和发展提供高质量的学理支持。百年来，汉语学人在探索汉语儿童语言发展和评估的道路上披荆斩棘，初步建立了标准化和非标准化相结合的评估体系，描绘了汉语儿童语言发展的多模态画像，并探索了智能化在语言评估中的可行性，为汉语儿童语言研究奠定了强有力的基础。展望未来，应突破传统学科规约、建立扎根中国大地的大“儿童语言”学科体系，转变西式思维、加强汉语儿童语言评估系统的自主研发，拥抱数字时代、建立可共享的汉语儿童语言发展数据库平台。促进儿童全面发展，助力国家语言文字战略发展，将是语言学人不断开拓进取的重要方向。

该文发表于《语言战略研究》2024年第4期，引用请以期刊版为准，转发请注明来源。

编排：逯琳琳

审稿：王飙余桂林

相关推荐

《语言战略研究》入选为CSSCI（2023—2024）来源期刊

《语言战略研究》入编《中文核心期刊要目总览》2023年版语言学类核心期刊

主持人语 | 李宇明：惠及儿童的儿童语言学

周鹏，谢媛：中国儿童语言发展研究的方法转向

饶宏泉：从评价副词的习得看儿童评价表达的发展

伍秋萍，郑佩芸：香港地区学龄儿童汉字认读水平测试研制与常模建构

张云秋，彭鹏程，晁代金：普通话儿童句法发展的里程碑

《语言战略研究》2024年第4期目录与提要