从纳什均衡到帕累托最优，为何围棋有时也要"得饶人处且饶人"？

体娱 2024-11-20 21:28 北京

三种答案

在之前讲“手割分析法”的那篇文章中，我在文末放了这样一道思考题。

然后我看评论区里的留言，大致分为以下这三种。

一种是发现白棋没活，于是表示白1需要在左下补棋。

另一种则是说白棋在补棋之前，可以在上方A位那里“先爬一下”再去左下补活。

最后一种则是只说了“我选爬”，没说“先爬一下”等其他内容。

对此我觉得从“我选爬”与“先爬一下”的描述差异中，背后所折射出的思考过程很有意思。

于是我们今天就以此为题，讲一下局部最佳与全局“大局观”之间的区别。

让别人无路可走

这里说“先爬一下”的最大问题在于：在白1的爬的时候，你要让黑棋怎么应呢？

黑棋如果挡的话，白2在外面有点的先手便宜。

这样黑1的这步挡，实际上并没有挡到目。

而黑棋若是尖三三的话，同样也是“这招棋走了跟没走差不多”。

于是我们在这里便发现了一件有趣的事情：因为白棋在左上把黑棋逼到“无棋可下”，所以黑棋只得被迫选择脱先（从而获得了更多的东西）。

换言之：如果你觉得虽然都是后手，但A的价值比B大，有这种判断偏差其实是很正常的（老实说，看AI之前我也没意识到B比A更“重要”）。

但若是觉得A是先手，然后A和B都是你的。那这种“想当然”的思路，其实是需要做出一些改变。

从纳什均衡到帕累托最优

本章关键词1："纳什均衡"，又称为"非合作博弈均衡"，是博弈论中的一个重要术语，以约翰·纳什命名。大致意思是：在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，而该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下，其选择的策略是最优的，那么这个组合就被定义为纳什均衡。

本章关键词2："帕累托最优"又称"帕累托效率"是指资源分配的一种理想状态，假定固有的一群人和可分配的资源，从一种分配状态到另一种状态的变化中，在没有使任何人境况变坏的前提下，使得至少一个人变得更好，这就是帕累托改进或帕累托最优化。

省流小助手：短期博弈/讲法律用纳什均衡，长期博弈/讲道德用帕累托最优。

如果从“博弈论”的角度来看，这事其实类似于单次博弈与多次博弈之间的区别。

在短期的单次博弈中，大家往往会像“纳什均衡”那样，采取对自己最有利的策略。

但最终结果却未必有利，甚至有可能像"囚徒困境"那样，把事情弄得两败俱伤。

比如像景区等单次博弈的场合，商家往往会采取竭泽而渔的“宰客”策略。

而那些开在居民区面临多次博弈的商家，则相对更注重口碑的积累。于是就像"帕累托最优"那样，争取做到“你好我好大家好”。

那么围棋作为一款零和博弈的游戏，我们下棋时自然是要用最狠的招法，使获利尽量做到最大化。

只不过将对方逼至“无棋可下”之前，别忘了提前去确认一下，这里是否担心对方脱先或反击？

如果从这延伸下去，那么上期文章所提到的这个问题↓

其实同样可以用类似的思路，来进行解释与复盘。

许多事就像下围棋一样，虽然棋盘上有几百个点可供挑选。但能进我们视野，值得去思考判断的点，一般也就寥寥几个而已。

于是如果把一二十个格内，几个选点中的"局部最佳"。放到全局/整体几百个格的尺度来看，那它就未必还是最佳招法了。

遇到滑标怎么办？

除了围棋领域的思考方式可以迁移到其他领域以外，其实外界的知识有时也能用来反哺围棋。

比如大家在网上下棋时，想必都遇到过"滑标"。

那么对于网络9D以上的中高水平的人来说，出现滑标往往就意味着棋局随即进入"垃圾时间"。

滑标方一般不是当场认输，就是自暴自弃地随便乱拼几下。

于是不光滑标方感觉"很气"，另一边获利方浪费了下棋时的几十分钟时间，其实同样"很亏"。

然而有时候，我们其实也能看到一些不一样的做法。

例如前几年因为众所周知的原因，许多围棋大赛都是在网络进行。

在2021年围甲联赛金志锡执黑VS陈耀烨的对局中，金志锡的第57手不慎滑标，陈耀烨见状主动提出让对方悔棋！

随后两人将棋局复盘至滑标之前，并从57这里重新开始。

这里除了要为陈耀烨老师的高风亮节点赞以外，其实也能引发我们的一些思考。

如果大家都像陈耀烨老师这样，在遇到滑标时让对方悔棋，或是找个差不多的位置给对方"还回去"。

那样大家既不用担心自己滑标，同时对方滑标时也不用浪费时间，这样做其实对大家都有利。

在文章的最后，大家可以思考一下：左上角的这个形状，是哪一方比较赚呢？

-END-

http://mp.weixin.qq.com/s?__biz=MzIwMzg2NTU2Nw==&mid=2247545700&idx=1&sn=a23eaf90d5f824525cfc7548cb3c490e

奇略研究所

优质围棋棋评、原创题目和深度文章讲解，更多专业围棋内容和工具，尽在【奇略】APP。