多人谈丨韩先培：迫切需要探索大语言模型的语言与知识机理

学术 2024-09-13 17:58 北京

2024年第5期

“大语言模型”多人谈

本期嘉宾

韩先培

中国科学院软件研究所

迫切需要探索大语言模型的语言与知识机理

大模型是当前人工智能研究的最前沿，正逐渐成为信息产业的重要基础设施。但是，大模型虽然在写作、推理、规划、数学、代码等诸多领域都展现出了强大甚至比肩人类的能力，却经常出现内容幻觉、价值观错位、歧视偏见等问题。应该如何解决这一难题？

首先，要加强对大模型内部语言和知识机理的研究，实现对大模型的深入理解，从原理上保障大模型的可靠性。现有的各种大模型能力评测，大多把大模型看成一个黑箱，从外部行为评估大模型的能力，容易受到数据选择、指标设计、提示方案等因素的影响。而大模型机理研究把大模型看成一个白箱，分析不同大模型能力的内部过程，建立相应的因果机制和理论，从而实现更深层次的理解。当然，大模型机理研究面临诸多挑战，特别是大规模参数化表征以及核心过程（如预训练、指令微调、人类反馈强化学习）的复杂动态特性，这迫切需要研究人员发展出新的机理分析方法、工具和支撑资源。

其次，要将大模型作为审视语言、知识与智能机理的新视角。传统的智能机理研究往往以人为研究对象，并通过心理学、认知科学、神经科学和计算科学等领域的方法来探索大脑的工作原理。大模型是人类之外又一个呈现出智能的对象，且这个智能对象的内部参数和活动过程完全可控制可观测，这为语言、知识和智能机理的理解和研究提供了新的途径、方法和机遇。

最后，要研究大模型对人类社会语言和知识生态的影响，及其背后的成因和机制，并采取相应的干预手段。举例来说，我们最近发现，如果放任大模型自动生成的内容大量进入搜索引擎的文档库，会逐渐形成一个“沉默螺旋”过程，并最终导致内容多样性丧失的严重后果。因此，需要构建新的研究手段来研究机器智能和人类智能混合的社会形态，分析、模拟和思考机器智能对人类社会的深远影响，探索如何规避和干预其中的风险，从而让人工智能真正服务于社会效率和人们幸福感的提升。

综上，关于大模型，仍有许多语言与知识谜题需要去探索。一切都刚刚开始，未来有无限可能。

该文发表于《语言战略研究》2024年第5期，引用请以期刊版为准，转发请注明来源。

编排：逯琳琳

审稿：王飙余桂林

相关推荐

《语言战略研究》入选为CSSCI（2023—2024）来源期刊

《语言战略研究》入编《中文核心期刊要目总览》2023年版语言学类核心期刊

主持人语丨杨尔弘，胡韧奋：大语言模型与语言研究的双向赋能与融合发展

詹卫东，孙春晖，肖力铭：语言学知识驱动的空间语义理解能力评测数据集研究

李绅，胡韧奋，王立军：古汉语大语言模型的构建及应用研究

杨尔弘等：大语言模型的中文文本简化能力研究

《语言战略研究》2024年第5期目录与提要

《语言战略研究》2024年第4期目录与提要

《语言战略研究》2024年第3期目录与提要

《语言战略研究》2024年第2期目录与提要

《语言战略研究》2024年第1期目录与提要

约稿启事丨“国际中文教育”专题（每年一期）

约稿启事丨“汉语哲学”专题（每年一期）

约稿启事丨“全球视野下的闽粤客方言流布史”专题

约稿启事丨“语言文字法治问题”专题

本刊从未与任何第三方合作从事征稿、审稿及发稿活动

从不以任何形式收取版面费、审稿费

请认准本刊官方网站界面→

编辑部联系方式

电话：010-65219062，010-65219060

电子邮箱：yyzlyj@cp.com.cn

地址：北京市东城区王府井大街36号

投稿网址：yyzlyj.cp.com.cn

订阅方式

1.全国各地邮局订阅，邮发代号：82-104.

2.网店订阅：

（1）商务印书馆官方微店 （关注商务印书馆微信公众号；点击公众号页面底部的“官方微店”；在微店中搜索“语言战略研究”即可下单）

（2）商务印书馆京东旗舰店 （登录旗舰店，搜索“语言战略研究”即可下单）

3.中国邮政—微商城（微商城中搜索“语言战略研究”，即可预订全年）

↓↓↓点击“阅读原文”可访问本刊官网

http://mp.weixin.qq.com/s?__biz=MzI0NzIyNDEyMg==&mid=2687945087&idx=1&sn=b50fe49edd82fb32bbf29056bd6ebb25

语言战略研究

《语言战略研究》是我国第一份以语言政策和语言规划为主要内容的专业学术期刊，于2016年1月正式创刊。该刊由国家语言文字工作委员会指导，中国语言学会语言政策与规划研究会学术支持，商务印书馆主办出版。主编李宇明教授，执行主编郭熙教授。

最新文章

多人谈 | 冯志伟：数字智能和人类智能学习语言的方式不能等同

《语言战略研究》2024年第6期目录与提要

约稿启事丨“中国语言生活研究20年”专题（2025年第6期）

“大语言模型与语言学发展座谈会”在京举行

多人谈丨周小兵：“走出去”中国企业急需“中文+岗位”教学

多人谈丨郑艳群：应重视生成式人工智能在国际中文教育中的安全应用

多人谈丨张旺熹：加强汉语儿童语言研究，助力国际中文教育发展

多人谈 | 吴勇毅：以内容为核心是国际中文教学的一个重大转变

多人谈 | 王海峰：国际中文教育的社会化发展路向

多人谈 | 崔永华：结构功能文化相结合仍是国际中文教学的基本指导思想

多人谈 | 崔希亮：人工智能背景下国际中文教育学科发展的七个问题

陆俭明：从汉英语作为外语教学的差异试议智能时代的汉语教学

施春宏，马瑞祾：国际中文教育工程化的内涵、特征和原则

施正宇，赵美：清华大学东欧交换生中国语文专修班建班考

李宇明：语言明珠文化使者——序徐华东主编《汉英成语大辞典》

王汉卫，张馨月：论“人群特征”对国际中文教育的学科支撑

主持人语丨李泉：中文二语教学大时代的几点小思考

多人谈 | 宗成庆：打通文理学科壁垒，让语言研究融入AI发展大潮

多人谈 | 王斌：大语言模型促进语言应用开发的四个维度

多人谈 | 刘知远：大语言模型推动人工智能的智能涌现

多人谈丨刘鹏远：重视大语言模型对价值认知的重塑，防范国家意识形态相关风险

多人谈丨李涓子：大语言模型知识认知能力的存在问题与提升路径

多人谈丨韩先培：迫切需要探索大语言模型的语言与知识机理

杨尔弘等：大语言模型的中文文本简化能力研究

李绅，胡韧奋，王立军：古汉语大语言模型的构建及应用研究

詹卫东，孙春晖，肖力铭：语言学知识驱动的空间语义理解能力评测数据集研究

沉痛悼念王绍新教授

主持人语丨杨尔弘，胡韧奋：大语言模型与语言研究的双向赋能与融合发展

卷首语 | 刘海涛：数智时代语言规划须顺势而为

沉痛悼念吴东英教授

《语言战略研究》2024年第5期目录与提要

约稿启事丨“边境语言能力”专题（2025年第2期）

郭奇军：原生口语的抢救性调查 | 语言生活研究

赫琳，王炤宇：论老年语言抚慰丨语言生活研究

张素格，陈双新：海峡两岸暨香港“古异今混”部件的分合现状研究 | 语言生活研究

沉痛悼念袁晖先生！

沉痛悼念孙宏开先生

张义宾，戴熙玉，郭少阳，周兢：汉语儿童语言发展评估的进展与思考

张云秋，彭鹏程，晁代金：普通话儿童句法发展的里程碑

刘晓宇：语言障碍者高等教育语言服务个案研究

张虹倩，胡范铸：药品标签信息无障碍化的分析框架与问题发现

《中国语言生活状况报告（2025）》选题征集函

王玲：城市老年人语言服务问题调查研究

主持人语丨李宇明：无障碍社会应成为数字时代的美好理想

跨界谈丨河崎深雪：多元文化共生时代的“简明日语”

跨界谈丨宋萑：以信息无障碍助力教育包容

跨界谈丨孙善球：信息无障碍与5G无线覆盖方案优解

《中国语言生活状况报告（2025）》选题征集函

卷首语 | 邢向东：河湟方言语言接触中语法声调演变的平行性

田小琳，田静：社区词研究三十年 | 语言生活研究

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉