研究人员阐明语言模型在不同算术场景中的泛化机制，可指导大模型训练优化

科技 2024-12-01 15:32 北京

尽管大语言模型已经在许多任务中表现出色，但它们在超出训练集分布泛化方面的能力仍然未被充分理解。例如，在自然语言处理中，大语言模型在某些泛化任务中的确表现优异，但在其他任务中可能会产生事实性错误或误导性信息。

近日，上海人工智能实验室徐兴成研究员与包括上海科技大学张海鹏、赵梓博以及复旦大学杨燕青在内的合作者，通过一套统一的理论框架阐明了基于 Transformer 的语言模型在不同算术场景中的泛化机制，并揭示了任务属性和训练数据对于模型表现的决定性作用。这能帮助人们更好地理解模型泛化行为，还为更高效的数据训练以及更优的人工智能对齐提供指导。

首先，本次成果将能指导模型训练优化。通过对训练数据质量和覆盖范围加以分析，可以更好地理解向内和向外泛化的影响，从而优化训练数据的选择和使用，同时还能节省数据资源。此外，通过对任务属性进行分析，可以帮助设计与模型属性相容的结构，从而提升模型的向外泛化能力。

其次，本次成果将能用于自然语言处理研究。即将泛化理论用于自然语言处理中的复杂任务分析，使其能够更准确、更高效地处理各种语言任务。

再次，本次成果将能用于人工智能对齐与安全提升。通过深入理解大语言模型在不同任务中的泛化机制，可以设计出更加安全、更加可控的人工智能系统。

图 | 徐兴成（来源：徐兴成）

围绕泛化性，研究人员试图弄清：为什么不同任务之间会存在差异？在失败的任务中大语言模型究竟学到了什么？在成功的任务中大语言模型又是如何实现有效泛化的？

由于直接在自然语言任务开展探索受到数据复杂性、内外分布界定困难性以及评估标准不明确的制约，他们选择以算术任务作为研究模型泛化行为的重要途径。这些任务具有很好的数学结构和评价标准，提供了分析和理解泛化现象的理想环境。以此，他们希望回答几个关键问题：

首先，为什么在某些任务中，模型可以在合适的位置编码下正确地执行更长的未见算术任务（比如加法），而在更复杂的任务（比如乘法）中的效果却不尽如人意？

其次，为什么无论使用何种位置编码，模型在特定模数下（例如模 100）对于更长的未见模运算表现良好，而在非常接近的模数下（例如模 101）却表现不佳？

此前的研究者们通过各类实验，也发现了各种看似无关的分布外泛化现象，却缺乏统一理论。为了克服“盲人摸象’的困境，该课题组找到了一个统一分析框架，用以探索和揭示这些分布外泛化现象背后的统一理论。

基于此，他们定义和发现了向内分布外泛化概念和向外分布外泛化概念，从而让诸多长度泛化问题变得清晰起来。

同时，他们也发现了训练数据在向内泛化中和向外泛化中所扮演的不同角色，从而能够帮助人们理解训练数据覆盖范围对于模型泛化性能的影响。

另外，这一过程也让研究人员意识到任务属性对于模型表现差异的重要影响，从而回答了模型如何才能学会加法。

图 | 绝对位置编码语言模型在加法任务中的逐位测试准确率（来源：arXiv）

日前，相关论文以《看似不相关的关联：算术推理任务中生成模型泛化的原则性理解》（Relating the Seemingly Unrelated: Principled Understanding of Generalization for Generative Models in Arithmetic Reasoning Tasks）为题发布于 arXiv[1]，同时这篇论文正在投稿中。

图 | 相关论文（来源：arXiv）

后续，他们计划进一步深化对大语言模型泛化性的理解，并探索其在其他任务中的应用。

其一，将扩展到更复杂的任务，包括自然语言处理中的复杂语义理解、逻辑和因果推理等。

其二，将探索多模态模型的泛化性。

其三，将打造高效的数据训练方法。他们希望以此减少模型训练对大规模数据集的依赖，并提高模型在数据不足时的泛化能力。

其四，将实现人工智能对齐与安全。即利用研究人员对于泛化机制的理解，来增强人工智能系统的安全性和可靠性。

该团队补充称，他们也期望在人工智能的发展过程中引入更多的理论基础，从而减少试探性方法所带来的不确定性。他们相信通过集体的智慧和努力，未来的人工智能系统将更智能、更可靠。

参考资料：

1.https://arxiv.org/pdf/2407.17963

排版：初嘉实

01/ 中德联合团队揭开长新冠刺突蛋白新机理，开发新型三维成像技术，将造福全球数百万长新冠后遗症患者

02/ 清华学者制备电磁超表面传感器，可用于车载环境的非接触生理传感，将联合汽车厂商推进落地

03/ 科学家将二氧化硅缺陷“变废为宝”，打造新型非易失性存储器，数据存储时间长达10年以上

04/ 科学家打造活性液滴系统，基于全新耗散组装系统，可用于打造液滴机器人与人工细胞模型

05/ 西湖大学团队研发新型铝基跨尺度3D制造技术，极大提高结构材料加工尺度范围和精度

DeepTech深科技

DeepTech 是一家专注新兴科技的资源赋能与服务机构，以科学、技术、人才为核心，通过科技数据与咨询、出版与影响力、科创资本实验室三大业务板块，推动科学与技术的创新进程。DeepTech 同时是《麻省理工科技评论》中国区独家运营方。

研究人员提出模糊推理基准“青蛙”，助力理解大模型推理机制

科学家研发可穿戴超声传感器，可提供无创的连续性血压监测

微型化工厂：MIT衍生公司改造内燃机用废弃甲烷生产绿色燃料

李飞飞World Labs官宣新AI产品，一张图片生成交互式3D世界

科学家开发新型多光子显微镜，可实现大脑最深层皮层的大视野成像，定制组件已实现商品化

科学家开发深度学习方法DynamicBind，实现对复合物的动态结构预测

香港中文大学（深圳）数经院团队与中证报联合发布投顾大模型

价格大跌超50%，三星、铠侠计划减产NAND闪存

科学家研发全天候AI声呐分析系统，平均精度比当前最先进的方法提高9.5%，已成功完成实地部署

范德堡大学团队研发电化学离子分离平台，可用于提炼金属和能源转化

研究人员阐明语言模型在不同算术场景中的泛化机制，可指导大模型训练优化

胰岛素口服不是梦：无针胶囊正在改变药物递送方式

全球首个去中心化训练的10B级模型已正式开源，使用横跨三大洲的112块GPU训练而成

中德联合团队揭开长新冠刺突蛋白新机理，开发新型三维成像技术，将造福全球数百万长新冠后遗症患者

科学家研发微型变形机器人，在100毫秒内实现40%面积伸缩和定向运动

前硅谷工程师创办，合成生物学公司融资7300万美元，利用AI开发蛋白质工程

清华学者制备电磁超表面传感器，可用于车载环境的非接触生理传感，将联合汽车厂商推进落地

AI模拟人格技术新突破，两小时对话即可创造“数字分身”

LED亮度达116万尼特，浙大团队实现钙钛矿半导体可控p/n型掺杂

MIT开发高效算法大幅降低强化学习训练成本

科学家将二氧化硅缺陷“变废为宝”，打造新型非易失性存储器，数据存储时间长达10年以上

美国初创称将打造百万量子比特的光量子计算机，公司估值超过30亿美元

罗氏15亿美元收购了一家“现货型”细胞疗法开发商

量子计算新突破：MIT发现新型物质形态可构建量子比特

前Android副总裁开发AI Agent通用操作系统，已获5600万美元投资

科学家打造活性液滴系统，基于全新耗散组装系统，可用于打造液滴机器人与人工细胞模型

上交团队构建AI社会模拟器，数千智能体引领大模型自演进

基于全新技术框架与生成算法，AI初创公司解锁工业级3D AIGC

MIT揭秘无磁场条件下五层石墨烯中的电子“分身术”

西湖大学团队研发新型铝基跨尺度3D制造技术，极大提高结构材料加工尺度范围和精度

寻找亚太科技青年力量｜《麻省理工科技评论》“35岁以下科技创新35人”亚太区报名正在进行

Common Voice：用多语言数据打造包容性AI语音

初创公司研发新型减肥药，针对4个不同靶点，称融资金额高达数亿美元

SpaceX将执行核动力直升机“蜻蜓号”承载任务，前往土卫六探索生命存在的可能性

科学家开发高熵金属间化合物，法拉第效率达到95%，正联合业界开展催化剂放大实验

常德“科创·柳叶湖”合成生物制造创新创业大赛即将启幕

弹跳超过自身高度108倍，浙大团队开发双稳态软体弹跳机器人

打开AI黑箱：DeepMind开发的新工具可揭示大模型内部秘密

科学家开发无柱纯化高性能蛋白质制备方法，纯度达到98%，可用于研发酶制剂和诊断试剂

澳洲昆大团队研发新型聚合物吸附剂，短时间内实现超99%氟化污染物去除

蛋白质设计再突破！麻省理工团队利用人工智能与梯度优化开发新策略

在家就能查血：MIT开发微型硅光芯片血液检测系统

科学家研发“仿心脏”电极材料，促进离子流传输，解决钠离子电池离子传输动力学缓慢问题

亚马逊向Anthropic追投40亿美元，Anthropic将使用前者芯片训练AI模型

还原真实世界：MIT用“AI+物理模拟”为机器人打造虚拟训练场

诺奖得主联合创办，初创融资3000万美元，开发新型糖免疫疗法

打破传统蛋白质进化方法局限性：MIT团队设计新型蛋白质大模型，发现比自然界高效百倍的突变体

寻找定义未来的科技先锋丨2024年度“35岁以下科技创新35人”中国报名中

被迫剥离Chrome和安卓？谷歌或将迎来“至暗时刻”

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉