主持人语丨杨尔弘，胡韧奋：大语言模型与语言研究的双向赋能与融合发展

学术 2024-09-04 17:00 北京

“

2024年第5期

”

专题研究一

大语言模型

● 主持人语 ●

本期嘉宾

杨尔弘

北京语言大学教授

胡韧奋

北京师范大学副教授

大语言模型与语言研究的双向赋能与融合发展

大语言模型（以下简称“大模型”^[1]）是当前生成式人工智能最主流的技术，具有强大的生成、迁移与交互能力。简单地说，该技术通过训练模型阅读海量文本，使其在语言表达、即时对话、任务规划、逻辑推衍等许多方面具备了与人类媲美的能力。目前，学界业界主要围绕3个方面开展大模型的研究：（1）倾尽所有算力，通过提高数据质量、优化模型架构和训练策略等各种手段来研发基础、通用大模型，提升模型能力；（2）深入探索大模型的机理，拓展其性能，将最初仅能处理文本的模型，推向兼具文本、语音、图片、视频处理能力的多模态大模型；（3）开发专用或领域大模型、多智能体框架，以满足特定目标，拓展其应用场景。这些研究为大模型应用奠定了物质基础，为大模型的使用者提供了模型选择空间。

大模型的评测研究是伴随其研发同时开展的。为了探究大模型各种能力的天花板，对比不同大模型对特定任务的适配性，引导模型不断地改进优化，满足应用需求，研究者开发了公共的评测平台，设计评测任务和测试试题，从语法、语义、语用、逻辑、知识、计算、推理、规划等各个维度开展大模型的能力评测。在所有评测任务中，语言能力的测试是其中最重要、最基础的内容。深入挖掘语言研究成果，精准地设计探测、激发大模型深层语言能力的测试试题，是利用语言学研究成果引导大模型技术推进的一种方式，同时也向语言学研究提出了挑战。

大模型超强的智能表现，不但大跨步地推进了人工智能的发展，改变了其研究范式，同时也深刻影响着社会生活，为各个领域的研究带来新的契机。就语言研究领域而言，大模型为语言研究带来了新的研究对象和工具。首先，大模型是通过海量阅读、自注意力机制、强大的神经网络、反馈学习等技术学到了与人类比肩的语言能力，这些技术与人类获得语言能力的过程是否一样？与已经存在的语言学理论是否一致？其次，大模型使自然语言不再是人类独有独用的产物与工具，机器生成的与人类产出的语言及其内容各自有什么特点？第三，大模型作为分析语言数据的强大工具，促进了大规模、深层次的语料加工，既可以辅助语言现象的系统描写和语言规律的挖掘，也可以为模型训练提供高质量的数据。因而，大模型与语言研究是双向赋能、融合发展。

将大语言模型与语言研究相结合，首先要了解模型的“能”与“不能”。前期研究表明，大模型擅长解决答问、闲聊（含角色扮演）、翻译、文本摘要、改写、创作、信息抽取、代码分析与生成等类别的任务，但在以下能力上存在缺陷：（1）大模型往往生成流畅但不准确的内容，即产生“幻觉”现象，表现为语义理解、逻辑关联、基本常识、领域知识等方面的错误。由于大模型的工作机制目前仍处于“黑箱”状态，解决幻觉问题还需要时日。（2）由于预训练模型的成本极高、微调数据规模有限，对于时效性、专业性较强的问题，大模型几乎没有能力处理。^[2]（3）大模型强依赖于预训练数据中的先验知识，生成文本极易受其影响，例如在修正语法错误时，模型往往存在过度修改润色的情况。（4）模型目前还无法准确理解、区分不同数字的含义。因而人们以试探、引导的方式应用大模型辅助人类提高效率。

利用大模型开展语言研究，有3种访问大模型的方式：（1）通过网页或者APP对话；如文心一言、ChatGPT、智谱清言等；（2）通过API调用，如GPT4、Qwen-turbo，智谱AI等都提供了API接口；（3）使用开源模型，如Llama系列、Qwen系列、ChatGLM系列等，还可对它们进行微调或二次开发。无论哪种方式，其本质主要是利用大模型强大的上下文学习能力和迁移能力，引导其适应具体的语言研究任务。因而先测试模型对应的能力，然后有目标地开展引导，诱发出大模型潜在的知识和能力，已经成为大模型应用的一种主要模式。

“提示”是当前最通用、最便捷的引导大模型的方式。“提示”有不包含任务样例（零样本），包含少量样例（少样本），以及附加额外知识等形式，而提示词的设计直接影响对模型引导的效果。设计提示词的常用策略包括：

第一，为模型设定角色，如“擅长分析语言现象和总结规律的语言学家”“经验丰富的国际中文教师”等。

第二，给出清晰具体的任务说明和解决方案，包括：（1）提供必要的背景信息和具体的任务说明；（2）给出问题和答案示例；（3）针对复杂任务设定分步骤解决思路；（4）提供外部知识库或工具检索等必要的专业知识作为参考；（5）设置限制和要求；等等。

第三，在提示词的格式方面，建议：（1）用换行符和###、"""等分隔符来区分提示的不同部分（如指令、背景信息、输入数据等），让模型更容易区分和理解；（2）可要求模型以特定格式输出，如列表、JSON等，以便在批量调用时获得结构化、易解析的结果。

第四，通过API调用模型或使用开源模型时，宜参考文档设置合理的参数值，例如，当追求模型输出的一致性和稳定性时，可将temperature参数设为接近0的数值。^[3]

综上，利用大模型开展语言研究时，人的判断、决策与引导扮演着极为关键的角色。人工智能时代的语言研究亟需深入诊断模型机理，充分挖掘模型潜力，使得大语言模型和语言研究实现双向赋能。在这一探索过程中，或会引发诸多值得探讨的新问题，例如，语言学知识如何赋能语言智能技术发展，实现知识与技术的双向迭代？如何高效地为模型注入专门领域知识，以减轻幻觉现象，并促进解决专业性问题？人类社会存在高度多样性和复杂性，如何探究模型与人类价值观对齐的方法论？多模态大模型与多智能体等技术的发展又会为语言研究带来哪些新的挑战和机遇？为此，《语言战略研究》期刊专门组织了“大语言模型”专题，邀请语言学与计算机领域的研究者们共同探讨相关问题，围绕领域模型的研发、模型的特定语言能力测试任务设计与分析，利用大模型辅助具体语言问题的研究，交流他们的研究成果；同时，就语言知识的研究与利用、语言数据与人类知识的相互融合来为大模型提供资源，大模型及智能体对研究和应用产生的影响，以及大模型带来的安全、价值取向和伦理问题，交叉学科人才培养，等等，给出了研究者的观点，期待通过上述交流，推动语言学与人工智能技术的创新融合发展。

[1]　本应简称为“大语模”，但现在业界普遍使用“大模型”。

[2]　为缓解这一不足，研发团队往往会借助联网搜索等方式为模型提供额外参考信息，使其支持较好的实时反馈，但对于互联网无法检索到有效信息的专业性问题，模型仍难以提供理想回复。

[3]　temperature和top_p等参数影响模型输出结果的多样性和随机性，网页或APP端产品往往会设置较高的参数值，因此同一个问题多次提问会收到不同结果。

该文发表于《语言战略研究》2024年第5期，引用请以期刊版为准，转发请注明来源。

编排：逯琳琳

审稿：王飙余桂林

相关推荐

《语言战略研究》入选为CSSCI（2023—2024）来源期刊

《语言战略研究》入编《中文核心期刊要目总览》2023年版语言学类核心期刊

《语言战略研究》2024年第5期目录与提要

《语言战略研究》2024年第4期目录与提要

《语言战略研究》2024年第3期目录与提要

《语言战略研究》2024年第2期目录与提要

《语言战略研究》2024年第1期目录与提要

约稿启事丨“国际中文教育”专题（每年一期）

约稿启事丨“汉语哲学”专题（每年一期）

约稿启事丨“全球视野下的闽粤客方言流布史”专题

约稿启事丨“语言文字法治问题”专题

本刊从未与任何第三方合作从事征稿、审稿及发稿活动

从不以任何形式收取版面费、审稿费

请认准本刊官方网站界面→

编辑部联系方式

电话：010-65219062，010-65219060

电子邮箱：yyzlyj@cp.com.cn

地址：北京市东城区王府井大街36号

投稿网址：yyzlyj.cp.com.cn

订阅方式

1.全国各地邮局订阅，邮发代号：82-104.

2.网店订阅：

（1）商务印书馆官方微店 （关注商务印书馆微信公众号；点击公众号页面底部的“官方微店”；在微店中搜索“语言战略研究”即可下单）

（2）商务印书馆京东旗舰店 （登录旗舰店，搜索“语言战略研究”即可下单）

3.中国邮政—微商城（微商城中搜索“语言战略研究”，即可预订全年）

↓↓↓点击“阅读原文”可访问本刊官网

http://mp.weixin.qq.com/s?__biz=MzI0NzIyNDEyMg==&mid=2687944975&idx=1&sn=ce7730dc97c1263b301fbee9361baec7

语言战略研究

《语言战略研究》是我国第一份以语言政策和语言规划为主要内容的专业学术期刊，于2016年1月正式创刊。该刊由国家语言文字工作委员会指导，中国语言学会语言政策与规划研究会学术支持，商务印书馆主办出版。主编李宇明教授，执行主编郭熙教授。

最新文章

多人谈 | 冯志伟：数字智能和人类智能学习语言的方式不能等同

《语言战略研究》2024年第6期目录与提要

约稿启事丨“中国语言生活研究20年”专题（2025年第6期）

“大语言模型与语言学发展座谈会”在京举行

多人谈丨周小兵：“走出去”中国企业急需“中文+岗位”教学

多人谈丨郑艳群：应重视生成式人工智能在国际中文教育中的安全应用

多人谈丨张旺熹：加强汉语儿童语言研究，助力国际中文教育发展

多人谈 | 吴勇毅：以内容为核心是国际中文教学的一个重大转变

多人谈 | 王海峰：国际中文教育的社会化发展路向

多人谈 | 崔永华：结构功能文化相结合仍是国际中文教学的基本指导思想

多人谈 | 崔希亮：人工智能背景下国际中文教育学科发展的七个问题

陆俭明：从汉英语作为外语教学的差异试议智能时代的汉语教学

施春宏，马瑞祾：国际中文教育工程化的内涵、特征和原则

施正宇，赵美：清华大学东欧交换生中国语文专修班建班考

李宇明：语言明珠文化使者——序徐华东主编《汉英成语大辞典》

王汉卫，张馨月：论“人群特征”对国际中文教育的学科支撑

主持人语丨李泉：中文二语教学大时代的几点小思考

多人谈 | 宗成庆：打通文理学科壁垒，让语言研究融入AI发展大潮

多人谈 | 王斌：大语言模型促进语言应用开发的四个维度

多人谈 | 刘知远：大语言模型推动人工智能的智能涌现

多人谈丨刘鹏远：重视大语言模型对价值认知的重塑，防范国家意识形态相关风险

多人谈丨李涓子：大语言模型知识认知能力的存在问题与提升路径

多人谈丨韩先培：迫切需要探索大语言模型的语言与知识机理

杨尔弘等：大语言模型的中文文本简化能力研究

李绅，胡韧奋，王立军：古汉语大语言模型的构建及应用研究

詹卫东，孙春晖，肖力铭：语言学知识驱动的空间语义理解能力评测数据集研究

沉痛悼念王绍新教授

主持人语丨杨尔弘，胡韧奋：大语言模型与语言研究的双向赋能与融合发展

卷首语 | 刘海涛：数智时代语言规划须顺势而为

沉痛悼念吴东英教授

《语言战略研究》2024年第5期目录与提要

约稿启事丨“边境语言能力”专题（2025年第2期）

郭奇军：原生口语的抢救性调查 | 语言生活研究

赫琳，王炤宇：论老年语言抚慰丨语言生活研究

张素格，陈双新：海峡两岸暨香港“古异今混”部件的分合现状研究 | 语言生活研究

沉痛悼念袁晖先生！

沉痛悼念孙宏开先生

张义宾，戴熙玉，郭少阳，周兢：汉语儿童语言发展评估的进展与思考

张云秋，彭鹏程，晁代金：普通话儿童句法发展的里程碑

刘晓宇：语言障碍者高等教育语言服务个案研究

张虹倩，胡范铸：药品标签信息无障碍化的分析框架与问题发现

《中国语言生活状况报告（2025）》选题征集函

王玲：城市老年人语言服务问题调查研究

主持人语丨李宇明：无障碍社会应成为数字时代的美好理想

跨界谈丨河崎深雪：多元文化共生时代的“简明日语”

跨界谈丨宋萑：以信息无障碍助力教育包容

跨界谈丨孙善球：信息无障碍与5G无线覆盖方案优解

《中国语言生活状况报告（2025）》选题征集函

卷首语 | 邢向东：河湟方言语言接触中语法声调演变的平行性

田小琳，田静：社区词研究三十年 | 语言生活研究

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉