大模型不懂得谦虚-越大的模型错误越多，该如何让大模型变得正直

科技 2024-09-30 16:41 陕西

，这周四的Nature主刊上，关于大模型参数越大，越容易出差的研究，吸引了笔者的关注。这项研究对比了不同参数量的开源的llama2，bloom以及闭源的chatGPT，针对数学计算，逻辑推理，空间位置以及科学知识等偏理科的问题，考察模型的性能。结果显示，大模型果然能将过去几乎没有概率正确回答的问题以一定概率回答，但出现了下面反常现象，导致模型店准确率反而由于参数的增加而下降。

该研究将大模型的回复分为了正确，错误以及回避（承认自己答不出）。在较小参数的模型中，模型虽然无法回答，但会回避问题，然而较大参数的模型，举一个例子：虽然将正确回答的概率从1%提升到了60%，但回避问题的概率变为了10%，剩下的30%模型会回答错误；而小参数的模型会有90%的概率回避问题，这导致的结果就是模型参数变大后，反而答错的概率变大。

https://www.nature.com/articles/s41586-024-07930-y

针对该问题，也行读者会觉得新出的GPT o1能解决问题，然而从o1出现，说明当在训练集，参数集上的超线性scaling law逐渐由于训练数据的耗尽而失效时，官方选择了通过时间的sclaing up（三思而后行）来试图继续延续指数级的性能提升。然而正如S型创新在一个周期达到峰值后，需要启动另一个维度来继续，思考过程的延长，不一定能带动群体智慧的涌现，笔者古话“从君明则臣直”中想到，当下的大模型既然是助手，那不妨尝试让其变得更加正直，从而提升用户体验。

所谓让模型变得正直，其实对于文科及理科的问题都会有帮助。对于何为有德之人，古代的哲学家有很多描述，例如诚信，勇敢，善良，宽容等众多道德品行。笔者设想，可以在构建专家混合模型时，让每个模型不再按照其擅长的问题分，而是按照品行去细分。除了上述列出的品行，还可以加入非常规思维，有想象力等特性，让每个子模型分别根据自己微调的性格特征先进性回复。之后还可以引入图结构，通过让预训练后的模型进行批判，总结，模拟不同性格间的内心辩论，通过有向无环图（DAG）的方式迭代，之后再次由各个性格的子模型回复，批判，最终先对各组回复及批判按质量排序，并由一个负责总结的模型得到最终结果。

相比于链式的scaling，上述的多性格混合模型范式，笔者觉得有如下几个优势：

1，训练过程中，可以通过引入有意识的反馈（选择训练语料，根据性格由人类通过打分给出反馈）会更使得模型在完成了基线数据的基础训练后，变得特化的更加多样化。由于群体智能的涌现依赖于多样性，群体异质性（如果一个群体中大家都众口一词，那么就没有可能出现1+1大于2的结果）相比让模型具有能通过RAG获取的专业知识，不同性格特色的专业模型在回复上将可能更加多样，从而更可能提升专家混合模型的性能。

2，在推理过程中，用户可以根据自己的偏好，结合任务类型去动态调整不同模型的权重，例如在需要关注准确性的任务上，可以让表现的诚信的自模型具有更大的权重，预期头脑风暴的任务，将特征为非常规思维的模型店权重增加。这样用户可以根据自己的预期，以透明的方式去使用混合模型，从而让用户能更透明地去和模型互动。

3，使用图结构后，用户可以根据自己预期的计算量，去调整计算过程，例如可以改变图的深度和宽度，例如深度设为1的时候，宽度设为3的，只是由选定的权重最高的3个子模型进行回答，并由这三个模型对其它模型的结果进行批判，之后由负责总结的模型得到汇总结果，这种方式所需的计算成本相对低。而当深度为3的时候，则需要进行3轮的迭代，从而中间会产生更多的token，预期效果提升的同时，计算量也会提升。

4，由于采用了DAG，不同自模型间的反馈将可以非线性的方式展开，例如准确度要求较高的任务，可由性格特征为尽职的模型检查推理过程是否有跳步骤，由性格特征为谦逊的模型去生成相对成熟的推理步骤，如此这样两个性格特征模型店合作，将可能避免前文提到的模型越大，错误出现的概率越多的悖论，从而让模型学会谦虚。而对于用户希望大模型能促成创意的场景，性格特征为勇敢的模型，可以被设置为去修改特征为非常规思维模型制定的推理步骤，去掉其中由训练数据包含的假设，从而使模型得到的答复更加天马行空。这样的反馈操作（图中的连边）可以通过概率的方式形成，进而使得模型能够超越思维链，获得更多的涌现能力。

更多阅读

关于塔勒布对大模型的批评性思考

增强个体创造力后，大模型会造就一个更创意的世界吗？

从复杂到清晰：大模型如何提升科学家和公众对科学的理解

http://mp.weixin.qq.com/s?__biz=MzA3MzQwNzI3OA==&mid=2651393695&idx=1&sn=3b95c63fdd3edbe936f627747451c0ab

混沌巡洋舰

人工智能已经在迅速的改变我们的世界，当它与脑科学结合，这种改变将最终达到人本身。混沌巡洋舰站立在这两个未来的塑造者之间, 讨论这场正在发生的变革对每个行业和个体的影响。我已委托“维权骑士”为我的文章进行维权行动。

最新文章

两宋繁华，底色却是国富民穷

诺贝尔经济学奖得主西蒙·约翰逊作品，美国创新简史，对当下中国的启示

《声音改造大脑》揭示声音与大脑的关系-被低估的声音与听觉

诺贝尔奖两次颁发给AI，我们要担心AI抢了我们饭碗吗

超凡智能体：从生命起源到AI智能体

《分心的优势》-重新理解被误读的注意缺陷多动障碍

《深井效应》-聚焦童年创伤和未来身体健康的关系

北京大学人工智能与脑科学课题组招人啦

诺奖颁给交叉学科，对「AI for Science」意味着什么？

2024年诺贝尔物理学奖得主辛顿：无法坐下的AI先驱

为了获诺奖，AI不仅要懂物理学，还要懂哲学？

回形针行动：它可能是有史以来最大的知识产权盗窃案

《便宜货》：透视消费主义的多面镜

读书笔记｜A Thousand Brains

那些“简史”们到底错在哪了——格雷伯锐评戴蒙德、赫拉利

大模型不懂得谦虚-越大的模型错误越多，该如何让大模型变得正直

《成瘾的深渊：大脑暗藏的致命诱惑》读书笔记

Nature最新发现全脑决策动力学

未来学家库兹韦尔：2045年人类的思维能力将扩展数百万倍

极端天气频发，全球变暖中如何赢得新气候战争

从复杂到清晰：大模型如何提升科学家和公众对科学的理解

如何用好大模型辅助写作的五条建议

《智人之上》书评-促成合作的神话与官僚将分别如何被AI改造

大脑能量理论-精神疾病提供突破性的认知框架

为什么经常庆功，就能成功？

从同行评审到团队构建：14篇科学学论文揭示科学不平等的起源

读书笔记｜The Twittering Machine｜社交媒体的黑暗真相

关于塔勒布对大模型的批评性思考

尤瓦尔·赫拉利：人类是如何走上自我毁灭的道路的？

中国大飞机：打破中国制造的“合作悖论”

学术领域“了不起的盖茨比曲线”：导师与学生的学术影响力跨越代际传递

【新书】《万物的声音》：关于听觉、科学和生活世界的盛宴

北大智元联合实验室招人了

不是历史封闭了可能性，而是我们缺乏想象力-《人类新史》

两个圈外人的前卫实验，引发了一场不凡俗的科学革命

服美役：美是如何奴役和消费女性的

科学天才Wolfram新作：费曼、乔布斯、冯·诺伊曼……他写活了人类史上最聪明的15位大师

“我用整个大脑来爱你”｜《当大脑坠入爱河》

Anil Seth：机器的思考是否具有意识？| 智能渐近线

追问快读 | Anil Seth：机器的思考是否具有意识？

“你感到孤独，只能说明你是一个人类。”｜《当大脑陷入孤独》

在吃得饱饭的时代保有可学习性

智人之上-《人类简史》《未来简史》《今日简史》作者尤瓦尔时隔六年重磅新作

《细胞：地球生命的建筑师》：新的细胞科学如何改写生命的故事？

一位作家耗时七年写下30万字：用文字捍卫想象力，是人类在AI时代的尊严

贫穷有罪？贫民区的诞生与影响

《具身智能》揭秘下一代人工智能发展方向，反思智能起源

城市的野性之美：探寻那些被遗忘的自然角落

新书上架 | 故事、骰子和会思考的石头

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉