2024年第5期
“大语言模型”多人谈
本期嘉宾
李涓子
清华大学计算机系
大语言模型知识认知能力的存在问题与提升路径
知识工程旨在将知识集成于计算机系统,为复杂任务提供解决办法。大语言模型具有语言理解、推理和问题求解能力,为知识工程提供了新途径,成为迈向通用智能的基础。但大模型当前还存在的知识幻觉和复杂任务推理求解能力局限性等问题亟待解决。
知识评估是衡量大语言模型知识认知能力的重要手段,需要从知识内容、认知能力和知识评测指标等多维度系统展开。知识内容评测应涵盖大模型训练中已知和不断演进的不同类型的知识(如概念、实体、事件及其关系等);认知能力评测应用从知识记忆、理解、应用和创造等不同认知层次进行;而知识评测指标则应采用系统和标准化指标进行评估,以更全面、可靠地评估大模型的知识认知能力。应该研究自动评测方法,以大模型为考官,解决人在评测过程中存在偏见和大模型能力增强后人在评测中存在局限性的问题。
当前大语言模型在处理复杂知识和不完整知识方面仍然存在挑战。复杂知识挑战主要表现为知识结构的复杂性和知识表达的多样性。大模型难以理解复杂的知识结构,如实体、关系、事件和概念以及其间的复杂关系;同样的知识可以通过不用语言形式表达,大模型也难以处理。在知识不完整性方面,大模型要能够利用外部资源,并与内部参数化知识进行整合。这就需要对大模型获取外部资源、利用自身大模型中知识以及处理语言模型内知识与外部知识冲突能力进行系统评测。目前评测表明,大模型在外部知识获取、利用和内外部冲突知识处理方面存在一定的挑战。
为提升大模型知识能力,可以思考以下技术途径。研究大模型在知识存储、推理和结构理解方面的机理,有助于深入理解其知识能力;研究神经‒符号推理编程方法,有助于提高大模型解决复杂密集型知识和多源融合知识的处理能力;研究知识对齐方法,让大模型在文本、图片和视频的token级和patch级与知识元素进行有效对齐,是让大模型理解现实世界的关键,可以帮助大模型提高知识理解、推理和交互能力。
该文发表于《语言战略研究》2024年第5期,引用请以期刊版为准,转发请注明来源。
编排:逯琳琳
审稿:王 飙 余桂林
相关推荐
《语言战略研究》入选为CSSCI(2023—2024)来源期刊
《语言战略研究》入编《中文核心期刊要目总览》2023年版语言学类核心期刊
主持人语丨杨尔弘,胡韧奋:大语言模型与语言研究的双向赋能与融合发展
詹卫东,孙春晖,肖力铭:语言学知识驱动的空间语义理解能力评测数据集研究
本刊从未与任何第三方合作从事征稿、审稿及发稿活动
从不以任何形式收取版面费、审稿费
请认准本刊官方网站界面→
编辑部联系方式
电话:010-65219062,010-65219060
电子邮箱:yyzlyj@cp.com.cn
地址:北京市东城区王府井大街36号
投稿网址:yyzlyj.cp.com.cn
订阅方式
1.全国各地邮局订阅,邮发代号:82-104.
2.网店订阅:
(1)商务印书馆官方微店 (关注商务印书馆微信公众号;点击公众号页面底部的“官方微店”;在微店中搜索“语言战略研究”即可下单)
(2)商务印书馆京东旗舰店 (登录旗舰店,搜索“语言战略研究”即可下单)
3.中国邮政—微商城(微商城中搜索“语言战略研究”,即可预订全年)
↓↓↓点击“阅读原文”可访问本刊官网