为什么笨蛋自信满满,聪明人却充满怀疑?罗素说,这就是现代社会

财富   2024-12-24 23:46   广东  

自信校准



1/4

你真的缺乏自信吗?


“我从小就缺乏自信,请问老师,怎样才能变得自信起来呢?”


后台常常有人向我咨询这个问题,但我内心其实很好奇:为什么你会觉得自己没有自信呢?至少你在‘缺乏自信’这件事上,还是很有自信的嘛!


要知道,真正的牛人往往都是缺乏自信的。


心理学家贾斯汀•克鲁格曾经为学生安排了一个语法测试,并要求他们写下预估的分数。然后教授按实际成绩把学生分为四等,并和他们预估的成绩作比较:



三角形构成的那条线是学生考后的估分,可以看出,这个实验非常巧妙,因为学生们一般是不做语法测试的,缺少过往的参考成绩,所以最后的预估完全依赖自信程度。


最后的实际成绩(圆点构成的那条线)显示,最差的四分之一的“学渣们”才考了平均十多分,最好的四分之一的“学霸们”平均90多分。


这个实验中提供了一些关于自信度的观察:


1、能力最差的人对自己的评价离事实最远;

2、能力中间偏前的人对自己的评价最准;

3、中间偏后一点的人,对自己的评价最高;

4、能力最强的人对自己的评价偏低


所以这篇论文的题目叫《论承认自己无能的困难如何导致自我评价的膨胀》。


很多研究都表明,一个人表现出的自信和他的智商、专业度、用心程度等无关(也有报告认为有非常微弱的关系)(Paese&Sniezek,1991;Ryback,1967;Sniezek&Henry,1989,1990),也与决策质量无关,“信心—正确率”平均相关系数仅为0.28( Sporer,Penrod,Read,& Cutler,1995) 。


问题在于,你的自信,可能会影响别人对你的判断,比如法庭上振振有辞的目击证人,对陪审团的影响更大,但研究也表明,目击证人对其证词的信心与证词的实际准确程度没有半毛钱关系。


这才是大家都希望自己更自信的真实原因,自信的人可以争取他人更多的信任和资源,只是不能提高决策质量。


所以说从决策效果的角度,每个人都有自信上的问题,不一定是缺乏自信,也可能是过度自信,更可能是不知道自己此刻到底应该过度自信还是缺乏自信。


这个案例我在之前的文章中引用过,但我没有仔细分析它的意义,直到最近,微信做了一份对自己的生成式人工智能系统GPT-4的评估报告,我才发现,这件事不只是人类对自己的要求,在人工智能训练中至关重要。


专业的说法是“信心校准”。



2/4

人和人工智能都不知道何时该有信心


ChatGPT是一个生成式的人工智能,它的工作机制是不断预测下一个字的概率,选择概率最大的那一个(具体原理见我最近写的一系列文章)。但我们知道,很多情况下,出现概率最高的,只是常见的答案,不一定是正确的答案。


ChatGPT的很多回答,内行人一看就知道是错的,但如果是外行——判断依据只能是对方是否内行?回答的语气是不是很肯定?如果ChatGPT用自信的、有说服力的方式陈述,就会骗过你。


如果我们不是用ChatGPT玩一玩,而是处理很重要的工作,那只要判断失误一次,我们就会对它丧失信心,不知道什么时候该信它,什么时候不该信。

所以,系统需要在训练时,不断自我调整参数,以在更多的场景下预测出正确的答案,并且在某些情况下,可以告诉你“它不确定”。


这个过程,就是信心校准,是系统的训练目标之一知道什么时候应该有信心,什么时候只应该猜测。


人类心理学上也有信心校准,用击中(hit) 与虚报(false alarm) 来对准决策正确与决策错误时对应的信心水平,以让不同信心水平与正确率产生相关性,简单说,在你做出错误决策时,你能否自我评估出自信不足?在你做出正确决策时,你是否更有信心?


这种校准对后续决策具有重要的监控作用,比如,研究发现不同的信心水平可以通过调节后续行为的变化程度(即学习率) ,从而优化行为选择。


经过RLHF训练的GPT-4在这个问题上,比GPT-3.5有很大的改进,比如左边的问题,它放弃了常见但错误的说法(一句英语谚语),而选择了正确但不常见的观点。


但在回答右边的问题时,仍然落入了“高概率陷阱”,它“忽略”了“演员的儿子”这个条件,根据其他条件得到了更常见的答案——猫王,实际上答案是不太出名的另一个Elvis。



这说明GPT-4的自信校准仍然有缺陷。


如果你对人工智能未来改进后可以帮助你工作这件事,有比较高的期待的话,微软的报告不是一个好消息。他们发现,预训练的模型已经达到了高度校准,然而,在后训练过程中,校准度却再度降低了。


简单说,自信校准的提升遇到瓶颈,很可能是多个训练目标之间存在冲突,也可能是一类问题的自信校准提升的同时,又会降低另一类问题的自信校准。


这是不是预示着一种可能,GPT永远无法对自己的预测准确性进行正确的评估,因此也永远无法达到可以完全信任的地步?


本文研究人工智能信心校准的问题,还是为了回到我们应该如何看待自信的问题上,由于机器的神经网络学习是对人类学习的模仿,是否意味着,人类自身也无法正确评估自己的自信程度?


也许,更现实的做法还是回到“我们可能在什么问题上过度自信,什么问题上信心不足”这个问题上来。


前面一章的实验阐述了自信校准与个人能力的关系,下一个实验,分析的是自信校准与任务本身的关系。



3/4

做有些把握,又不是很确定的事


心理学家利希滕斯坦和菲什霍夫设计了一系列实验(1977),得到了“人什么时候会过度自信”的一些有趣的结论:


结论一:我们在预测概率为50%的随机事件中,“过度自信偏差值”最大——即赌徒心态。


最经典的例子就是股票预测了。无数实验证明(包括经典的飞镖选股实验),股票走势大部分时间是随机的,上涨和下跌的概率是50%。


所以那些没怎么赚到钱的老股民,几乎都是自信校准失败者,这就是股票市场的逆向淘汰机制,凡是投资能力普通且自信校准正常的人,都在亏损后认清现实而退出了,剩下的就都是过度自信的人了。


结论二:当我们面对成功概率为80%的决策时,“自信偏差值”为零。


前面说,股票走势大部分时间是随机的,但仍然有少数时刻,有明显的趋势,上涨或下跌的概率接近80%。


所以,最成功的职业投资者大部分时间都在休息,不是真的休息,而是不停寻找接近80%大概率的机会,此时,投资者的判断非常准确,即不会高估,也不会低估。


结论三:超过80%极大概率事件,反而会让人信心不足。


所以真正的高手也不会盲目追求稳赢,因为就算有这样的机会,也很可能会导致你过度谨慎,错过时机。


总结一下:


完全没有把握的事,别做;

非常有把握的事,少做;

有一些把握,又不是很确定的事情,自信一点按你的判断去做。


前面分析了自信与能力的关系、自信与任务难度的关系,我忽然发现,这两种自信有细微的区别,分别代表“对自己的信心”和“对于做这件事的信心”,它们之间又有什么样的关系呢?



4/4

自信与工具自信


沃顿商学院的教授亚当·格兰特(Adam Grant)在他的著作《Think Again: The Power of Knowing What You Don't Know》一书中,提出过一个 “自信模型”。


他认为,人在做一件事时,有两种信心,一种是对自己有没有信心,一种是对这件事、对自己的办法或团队等等(作者统一称之为Tools)有没有信心,后者被称为“工具自信”。


根据这两个信心,他把人做一件事时的状态分布在四个象限内:



右下角的“习惯性自卑”是对自己没信心,但对做这件事的方法、资源、工具等等,有信心。


左下角的“躺平”是对自己没信心,对自己拥有的资源与方法也没有信心,彻底丧失了对未来的希望。


格兰特教授认为这两种都是我们刚进入社会时的初始状态,区别无非是在大公司,还是在小公司。


右上角的“盲目自大”,是相信自己的同时,对自己拥有的资源、方法也有信心,相信自己肯定能做好这件事。


格兰特教授认为这是大部分人必经的中间状态。


而左上角的“自信并谦逊着”是相信自己的同时,不确定目前拥有的资源是否足够,也不确定现在是不是做这件事的最佳时节,甚至不确定自己现在掌握的方法是不是有效。


如何理解呢?假如说,你是一个极有自信的人,但现在我让你学开飞机,你肯定没信心,但这并不能让你怀疑自己的能力。


格兰特教授认为这是人的最佳状态,此时的心态往往是:


第一、自己很有能力,但目前的方法不一定管用,事情也不一定能成;

第二、就算方法不管用,自己仍然是很牛的一个人;就算这件事我没办成,下一次换一个方法也能办成;

第三、就算下一次换一个方法也没能成,再做别的事自己也能成,反正自己最后一定成功。


这就把人的自信,和对资源方法的信心分离开来,前者是一种力量,一种无法证伪、类似信仰的力量;而后者是一件工具,是科学的、充满怀疑精神的、需要进行“信心校准”的工具——人工智能只有后者,没有前者。


所以,过度自信也谈不上是什么坏事,如果只做80%概率的事,人类哪儿来什么进步呢?如果不是我们当年那些过度自信的祖先,我们现在还生活在树上。



— THE END —

作者:人神共奋, 来源:人神共奋(ID:tongyipaocha),

往期精选

↘记得点亮“在看”,支持生意人~


生意人
传递财富资讯;行业动态,盘点商道,分享价值干货!从创富精神,人脉,到商业模式等方面解读!是成功人士,商业精英,年轻创业者值得关注的信息号!
 最新文章