从纳什均衡到帕累托最优,为何围棋有时也要"得饶人处且饶人"?

体娱   2024-11-20 21:28   北京  

三种答案

在之前讲“手割分析法”的那篇文章中,我在文末放了这样一道思考题。

然后我看评论区里的留言,大致分为以下这三种。

一种是发现白棋没活,于是表示白1需要在左下补棋。

另一种则是说白棋在补棋之前,可以在上方A位那里“先爬一下”再去左下补活。

最后一种则是只说了“我选爬”,没说“先爬一下”等其他内容。

对此我觉得从“我选爬”与“先爬一下”的描述差异中,背后所折射出的思考过程很有意思。

于是我们今天就以此为题,讲一下局部最佳与全局“大局观”之间的区别。

让别人无路可走

这里说“先爬一下”的最大问题在于:在白1的爬的时候,你要让黑棋怎么应呢?

黑棋如果挡的话,白2在外面有点的先手便宜。

这样黑1的这步挡,实际上并没有挡到目。

而黑棋若是尖三三的话,同样也是“这招棋走了跟没走差不多”。

于是我们在这里便发现了一件有趣的事情:因为白棋在左上把黑棋逼到“无棋可下”,所以黑棋只得被迫选择脱先(从而获得了更多的东西)。

换言之:如果你觉得虽然都是后手,但A的价值比B大,有这种判断偏差其实是很正常的(老实说,看AI之前我也没意识到B比A更“重要”)。

但若是觉得A是先手,然后A和B都是你的。那这种“想当然”的思路,其实是需要做出一些改变。

从纳什均衡到帕累托最优

本章关键词1:"纳什均衡",又称为"非合作博弈均衡",是博弈论中的一个重要术语,以约翰·纳什命名。大致意思是:在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,而该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。

本章关键词2:"帕累托最优"又称"帕累托效率"是指资源分配的一种理想状态,假定固有的一群人和可分配的资源,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,使得至少一个人变得更好,这就是帕累托改进或帕累托最优化。

省流小助手:短期博弈/讲法律用纳什均衡,长期博弈/讲道德用帕累托最优。

如果从“博弈论”的角度来看,这事其实类似于单次博弈与多次博弈之间的区别。

在短期的单次博弈中,大家往往会像“纳什均衡”那样,采取对自己最有利的策略。

但最终结果却未必有利,甚至有可能像"囚徒困境"那样,把事情弄得两败俱伤。

比如像景区等单次博弈的场合,商家往往会采取竭泽而渔的“宰客”策略。

而那些开在居民区面临多次博弈的商家,则相对更注重口碑的积累。于是就像"帕累托最优"那样,争取做到“你好我好大家好”。

那么围棋作为一款零和博弈的游戏,我们下棋时自然是要用最狠的招法,使获利尽量做到最大化。

只不过将对方逼至“无棋可下”之前,别忘了提前去确认一下,这里是否担心对方脱先或反击?

如果从这延伸下去,那么上期文章所提到的这个问题↓

其实同样可以用类似的思路,来进行解释与复盘。

许多事就像下围棋一样,虽然棋盘上有几百个点可供挑选。但能进我们视野,值得去思考判断的点,一般也就寥寥几个而已。

于是如果把一二十个格内,几个选点中的"局部最佳"。放到全局/整体几百个格的尺度来看,那它就未必还是最佳招法了。

遇到滑标怎么办?

除了围棋领域的思考方式可以迁移到其他领域以外,其实外界的知识有时也能用来反哺围棋。

比如大家在网上下棋时,想必都遇到过"滑标"。

那么对于网络9D以上的中高水平人来说,出现滑标往往就意味着棋局随即进入"垃圾时间"。

滑标方一般不是当场认输,就是自暴自弃地随便乱拼几下。

于是不光滑标方感觉"很气",另一边获利方浪费了下棋时的几十分钟时间,其实同样"很亏"。

然而有时候,我们其实也能看到一些不一样的做法。

例如前几年因为众所周知的原因,许多围棋大赛都是在网络进行。

在2021年围甲联赛金志锡执黑VS陈耀烨的对局,金志锡的第57手不慎滑标,陈耀烨见状主动提出让对方悔棋!

随后两人将棋局复盘至滑标之前,并从57这里重新开始。

这里除了要为陈耀烨老师的高风亮节点赞以外,其实也能引发我们的一些思考。

如果大家都像陈耀烨老师这样,在遇到滑标时让对方悔棋,或是找个差不多的位置给对方"还回去"。

那样大家既不用担心自己滑标,同时对方滑标时也不用浪费时间,这样做其实对大家都有利。

在文章的最后,大家可以思考一下:左上角的这个形状,是哪一方比较赚呢?

-END-

奇略研究所
优质围棋棋评、原创题目和深度文章讲解,更多专业围棋内容和工具,尽在【奇略】APP。
 最新文章