本期嘉宾
韩先培
中国科学院软件研究所
大模型是当前人工智能研究的最前沿,正逐渐成为信息产业的重要基础设施。但是,大模型虽然在写作、推理、规划、数学、代码等诸多领域都展现出了强大甚至比肩人类的能力,却经常出现内容幻觉、价值观错位、歧视偏见等问题。应该如何解决这一难题?
首先,要加强对大模型内部语言和知识机理的研究,实现对大模型的深入理解,从原理上保障大模型的可靠性。现有的各种大模型能力评测,大多把大模型看成一个黑箱,从外部行为评估大模型的能力,容易受到数据选择、指标设计、提示方案等因素的影响。而大模型机理研究把大模型看成一个白箱,分析不同大模型能力的内部过程,建立相应的因果机制和理论,从而实现更深层次的理解。当然,大模型机理研究面临诸多挑战,特别是大规模参数化表征以及核心过程(如预训练、指令微调、人类反馈强化学习)的复杂动态特性,这迫切需要研究人员发展出新的机理分析方法、工具和支撑资源。
其次,要将大模型作为审视语言、知识与智能机理的新视角。传统的智能机理研究往往以人为研究对象,并通过心理学、认知科学、神经科学和计算科学等领域的方法来探索大脑的工作原理。大模型是人类之外又一个呈现出智能的对象,且这个智能对象的内部参数和活动过程完全可控制可观测,这为语言、知识和智能机理的理解和研究提供了新的途径、方法和机遇。
最后,要研究大模型对人类社会语言和知识生态的影响,及其背后的成因和机制,并采取相应的干预手段。举例来说,我们最近发现,如果放任大模型自动生成的内容大量进入搜索引擎的文档库,会逐渐形成一个“沉默螺旋”过程,并最终导致内容多样性丧失的严重后果。因此,需要构建新的研究手段来研究机器智能和人类智能混合的社会形态,分析、模拟和思考机器智能对人类社会的深远影响,探索如何规避和干预其中的风险,从而让人工智能真正服务于社会效率和人们幸福感的提升。
综上,关于大模型,仍有许多语言与知识谜题需要去探索。一切都刚刚开始,未来有无限可能。
该文发表于《语言战略研究》2024年第5期,引用请以期刊版为准,转发请注明来源。
编排:逯琳琳
审稿:王 飙 余桂林
《语言战略研究》入选为CSSCI(2023—2024)来源期刊
《语言战略研究》入编《中文核心期刊要目总览》2023年版语言学类核心期刊
主持人语丨杨尔弘,胡韧奋:大语言模型与语言研究的双向赋能与融合发展
詹卫东,孙春晖,肖力铭:语言学知识驱动的空间语义理解能力评测数据集研究
本刊从未与任何第三方合作从事征稿、审稿及发稿活动
从不以任何形式收取版面费、审稿费
请认准本刊官方网站界面→
编辑部联系方式
电话:010-65219062,010-65219060
电子邮箱:yyzlyj@cp.com.cn
地址:北京市东城区王府井大街36号
投稿网址:yyzlyj.cp.com.cn
订阅方式
1.全国各地邮局订阅,邮发代号:82-104.
2.网店订阅:
(1)商务印书馆官方微店 (关注商务印书馆微信公众号;点击公众号页面底部的“官方微店”;在微店中搜索“语言战略研究”即可下单)
(2)商务印书馆京东旗舰店 (登录旗舰店,搜索“语言战略研究”即可下单)
3.中国邮政—微商城(微商城中搜索“语言战略研究”,即可预订全年)
↓↓↓点击“阅读原文”可访问本刊官网