多人谈丨李涓子：大语言模型知识认知能力的存在问题与提升路径

学术 2024-09-18 17:01 北京

2024年第5期

“大语言模型”多人谈

本期嘉宾

李涓子

清华大学计算机系

大语言模型知识认知能力的存在问题与提升路径

知识工程旨在将知识集成于计算机系统，为复杂任务提供解决办法。大语言模型具有语言理解、推理和问题求解能力，为知识工程提供了新途径，成为迈向通用智能的基础。但大模型当前还存在的知识幻觉和复杂任务推理求解能力局限性等问题亟待解决。

知识评估是衡量大语言模型知识认知能力的重要手段，需要从知识内容、认知能力和知识评测指标等多维度系统展开。知识内容评测应涵盖大模型训练中已知和不断演进的不同类型的知识（如概念、实体、事件及其关系等）；认知能力评测应用从知识记忆、理解、应用和创造等不同认知层次进行；而知识评测指标则应采用系统和标准化指标进行评估，以更全面、可靠地评估大模型的知识认知能力。应该研究自动评测方法，以大模型为考官，解决人在评测过程中存在偏见和大模型能力增强后人在评测中存在局限性的问题。

当前大语言模型在处理复杂知识和不完整知识方面仍然存在挑战。复杂知识挑战主要表现为知识结构的复杂性和知识表达的多样性。大模型难以理解复杂的知识结构，如实体、关系、事件和概念以及其间的复杂关系；同样的知识可以通过不用语言形式表达，大模型也难以处理。在知识不完整性方面，大模型要能够利用外部资源，并与内部参数化知识进行整合。这就需要对大模型获取外部资源、利用自身大模型中知识以及处理语言模型内知识与外部知识冲突能力进行系统评测。目前评测表明，大模型在外部知识获取、利用和内外部冲突知识处理方面存在一定的挑战。

为提升大模型知识能力，可以思考以下技术途径。研究大模型在知识存储、推理和结构理解方面的机理，有助于深入理解其知识能力；研究神经‒符号推理编程方法，有助于提高大模型解决复杂密集型知识和多源融合知识的处理能力；研究知识对齐方法，让大模型在文本、图片和视频的token级和patch级与知识元素进行有效对齐，是让大模型理解现实世界的关键，可以帮助大模型提高知识理解、推理和交互能力。

该文发表于《语言战略研究》2024年第5期，引用请以期刊版为准，转发请注明来源。

编排：逯琳琳

审稿：王飙余桂林

相关推荐

《语言战略研究》入选为CSSCI（2023—2024）来源期刊

《语言战略研究》入编《中文核心期刊要目总览》2023年版语言学类核心期刊

主持人语丨杨尔弘，胡韧奋：大语言模型与语言研究的双向赋能与融合发展

詹卫东，孙春晖，肖力铭：语言学知识驱动的空间语义理解能力评测数据集研究

李绅，胡韧奋，王立军：古汉语大语言模型的构建及应用研究

杨尔弘等：大语言模型的中文文本简化能力研究

多人谈丨韩先培：迫切需要探索大语言模型的语言与知识机理

《语言战略研究》2024年第5期目录与提要

《语言战略研究》2024年第4期目录与提要

《语言战略研究》2024年第3期目录与提要

《语言战略研究》2024年第2期目录与提要

《语言战略研究》2024年第1期目录与提要

约稿启事丨“国际中文教育”专题（每年一期）

约稿启事丨“汉语哲学”专题（每年一期）

约稿启事丨“全球视野下的闽粤客方言流布史”专题

约稿启事丨“语言文字法治问题”专题

本刊从未与任何第三方合作从事征稿、审稿及发稿活动

从不以任何形式收取版面费、审稿费

请认准本刊官方网站界面→

编辑部联系方式

电话：010-65219062，010-65219060

电子邮箱：yyzlyj@cp.com.cn

地址：北京市东城区王府井大街36号

投稿网址：yyzlyj.cp.com.cn

订阅方式

1.全国各地邮局订阅，邮发代号：82-104.

2.网店订阅：

（1）商务印书馆官方微店 （关注商务印书馆微信公众号；点击公众号页面底部的“官方微店”；在微店中搜索“语言战略研究”即可下单）

（2）商务印书馆京东旗舰店 （登录旗舰店，搜索“语言战略研究”即可下单）

3.中国邮政—微商城（微商城中搜索“语言战略研究”，即可预订全年）

↓↓↓点击“阅读原文”可访问本刊官网

http://mp.weixin.qq.com/s?__biz=MzI0NzIyNDEyMg==&mid=2687945105&idx=1&sn=bd126e9da604e9442ac3f02557b34226

语言战略研究

《语言战略研究》是我国第一份以语言政策和语言规划为主要内容的专业学术期刊，于2016年1月正式创刊。该刊由国家语言文字工作委员会指导，中国语言学会语言政策与规划研究会学术支持，商务印书馆主办出版。主编李宇明教授，执行主编郭熙教授。

最新文章

多人谈 | 冯志伟：数字智能和人类智能学习语言的方式不能等同

《语言战略研究》2024年第6期目录与提要

约稿启事丨“中国语言生活研究20年”专题（2025年第6期）

“大语言模型与语言学发展座谈会”在京举行

多人谈丨周小兵：“走出去”中国企业急需“中文+岗位”教学

多人谈丨郑艳群：应重视生成式人工智能在国际中文教育中的安全应用

多人谈丨张旺熹：加强汉语儿童语言研究，助力国际中文教育发展

多人谈 | 吴勇毅：以内容为核心是国际中文教学的一个重大转变

多人谈 | 王海峰：国际中文教育的社会化发展路向

多人谈 | 崔永华：结构功能文化相结合仍是国际中文教学的基本指导思想

多人谈 | 崔希亮：人工智能背景下国际中文教育学科发展的七个问题

陆俭明：从汉英语作为外语教学的差异试议智能时代的汉语教学

施春宏，马瑞祾：国际中文教育工程化的内涵、特征和原则

施正宇，赵美：清华大学东欧交换生中国语文专修班建班考

李宇明：语言明珠文化使者——序徐华东主编《汉英成语大辞典》

王汉卫，张馨月：论“人群特征”对国际中文教育的学科支撑

主持人语丨李泉：中文二语教学大时代的几点小思考

多人谈 | 宗成庆：打通文理学科壁垒，让语言研究融入AI发展大潮

多人谈 | 王斌：大语言模型促进语言应用开发的四个维度

多人谈 | 刘知远：大语言模型推动人工智能的智能涌现

多人谈丨刘鹏远：重视大语言模型对价值认知的重塑，防范国家意识形态相关风险

多人谈丨李涓子：大语言模型知识认知能力的存在问题与提升路径

多人谈丨韩先培：迫切需要探索大语言模型的语言与知识机理

杨尔弘等：大语言模型的中文文本简化能力研究

李绅，胡韧奋，王立军：古汉语大语言模型的构建及应用研究

詹卫东，孙春晖，肖力铭：语言学知识驱动的空间语义理解能力评测数据集研究

沉痛悼念王绍新教授

主持人语丨杨尔弘，胡韧奋：大语言模型与语言研究的双向赋能与融合发展

卷首语 | 刘海涛：数智时代语言规划须顺势而为

沉痛悼念吴东英教授

《语言战略研究》2024年第5期目录与提要

约稿启事丨“边境语言能力”专题（2025年第2期）

郭奇军：原生口语的抢救性调查 | 语言生活研究

赫琳，王炤宇：论老年语言抚慰丨语言生活研究

张素格，陈双新：海峡两岸暨香港“古异今混”部件的分合现状研究 | 语言生活研究

沉痛悼念袁晖先生！

沉痛悼念孙宏开先生

张义宾，戴熙玉，郭少阳，周兢：汉语儿童语言发展评估的进展与思考

张云秋，彭鹏程，晁代金：普通话儿童句法发展的里程碑

刘晓宇：语言障碍者高等教育语言服务个案研究

张虹倩，胡范铸：药品标签信息无障碍化的分析框架与问题发现

《中国语言生活状况报告（2025）》选题征集函

王玲：城市老年人语言服务问题调查研究

主持人语丨李宇明：无障碍社会应成为数字时代的美好理想

跨界谈丨河崎深雪：多元文化共生时代的“简明日语”

跨界谈丨宋萑：以信息无障碍助力教育包容

跨界谈丨孙善球：信息无障碍与5G无线覆盖方案优解

《中国语言生活状况报告（2025）》选题征集函

卷首语 | 邢向东：河湟方言语言接触中语法声调演变的平行性

田小琳，田静：社区词研究三十年 | 语言生活研究

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉