多人谈丨韩先培:迫切需要探索大语言模型的语言与知识机理

学术   2024-09-13 17:58   北京  
2024年第5期


“大语言模型”多人谈














本期嘉宾


韩先培

中国科学院软件研究所


迫切需要探索大语言模型的语言与知识机理

大模型是当前人工智能研究的最前沿,正逐渐成为信息产业的重要基础设施。但是,大模型虽然在写作、推理、规划、数学、代码等诸多领域都展现出了强大甚至比肩人类的能力,却经常出现内容幻觉、价值观错位、歧视偏见等问题。应该如何解决这一难题?

首先,要加强对大模型内部语言和知识机理的研究,实现对大模型的深入理解,从原理上保障大模型的可靠性。现有的各种大模型能力评测,大多把大模型看成一个黑箱,从外部行为评估大模型的能力,容易受到数据选择、指标设计、提示方案等因素的影响。而大模型机理研究把大模型看成一个白箱,分析不同大模型能力的内部过程,建立相应的因果机制和理论,从而实现更深层次的理解。当然,大模型机理研究面临诸多挑战,特别是大规模参数化表征以及核心过程(如预训练、指令微调、人类反馈强化学习)的复杂动态特性,这迫切需要研究人员发展出新的机理分析方法、工具和支撑资源。

其次,要将大模型作为审视语言、知识与智能机理的新视角。传统的智能机理研究往往以人为研究对象,并通过心理学、认知科学、神经科学和计算科学等领域的方法来探索大脑的工作原理。大模型是人类之外又一个呈现出智能的对象,且这个智能对象的内部参数和活动过程完全可控制可观测,这为语言、知识和智能机理的理解和研究提供了新的途径、方法和机遇。

最后,要研究大模型对人类社会语言和知识生态的影响,及其背后的成因和机制,并采取相应的干预手段。举例来说,我们最近发现,如果放任大模型自动生成的内容大量进入搜索引擎的文档库,会逐渐形成一个“沉默螺旋”过程,并最终导致内容多样性丧失的严重后果。因此,需要构建新的研究手段来研究机器智能和人类智能混合的社会形态,分析、模拟和思考机器智能对人类社会的深远影响,探索如何规避和干预其中的风险,从而让人工智能真正服务于社会效率和人们幸福感的提升。

综上,关于大模型,仍有许多语言与知识谜题需要去探索。一切都刚刚开始,未来有无限可能。

该文发表于《语言战略研究》2024年第5期,引用请以期刊版为准,转发请注明来源。

编排:逯琳琳

审稿:王   飙 余桂林


相关推荐

《语言战略研究》入选为CSSCI(2023—2024)来源期刊

《语言战略研究》入编《中文核心期刊要目总览》2023年版语言学类核心期刊


主持人语丨杨尔弘,胡韧奋:大语言模型与语言研究的双向赋能与融合发展

詹卫东,孙春晖,肖力铭:语言学知识驱动的空间语义理解能力评测数据集研究

李绅,胡韧奋,王立军:古汉语大语言模型的构建及应用研究

杨尔弘等:大语言模型的中文文本简化能力研究


《语言战略研究》2024年第5期目录与提要

《语言战略研究》2024年第4期目录与提要

《语言战略研究》2024年第3期目录与提要

《语言战略研究》2024年第2期目录与提要

《语言战略研究》2024年第1期目录与提要

约稿启事丨“国际中文教育”专题(每年一期)

约稿启事丨“汉语哲学”专题(每年一期)

约稿启事丨“全球视野下的闽粤客方言流布史”专题

约稿启事丨“语言文字法治问题”专题


本刊从未与任何第三方合作从事征稿、审稿及发稿活动

从不以任何形式收取版面费、审稿费

请认准本刊官方网站界面→

编辑部联系方式 

电话:010-65219062,010-65219060    

电子邮箱:yyzlyj@cp.com.cn

地址:北京市东城区王府井大街36号    

投稿网址:yyzlyj.cp.com.cn

订阅方式 

1.全国各地邮局订阅,邮发代号:82-104.    

2.网店订阅:

(1)商务印书馆官方微店  (关注商务印书馆微信公众号;点击公众号页面底部的“官方微店”;在微店中搜索“语言战略研究”即可下单)

(2)商务印书馆京东旗舰店 (登录旗舰店,搜索“语言战略研究”即可下单)   

3.中国邮政—微商城(微商城中搜索“语言战略研究”,即可预订全年)

↓↓↓点击“阅读原文”可访问本刊官网

语言战略研究
《语言战略研究》是我国第一份以语言政策和语言规划为主要内容的专业学术期刊,于2016年1月正式创刊。该刊由国家语言文字工作委员会指导,中国语言学会语言政策与规划研究会学术支持,商务印书馆主办出版。主编李宇明教授,执行主编郭熙教授。
 最新文章