阅读这本书的时候,不经意间和学友们讨论,才得知这本书的思想其实和我们东方古老文化推崇的“无为”很契合。老子在《道德经》里面也曾经说过“道常无为,而无不为”,道不必刻意去作为,但是却能成就天下万物。咱们老祖宗参透了的道理,在近期的西方,开始慢慢流行起来。
两位作者都是Open AI的研究成员,这本书是他们在科学研究的过程中蹦出的意外火花。人工智能通常有明确的目标和目的,而算法变成也是为了目标而服务。在研究的过程中,作者发现即使不给算法明确的目标或者目的,他们也能取得令人惊叹的结果,而且比那些设定了目标的算法更加优越。
同时,这一全新发现并不是直接回馈于他们本身所处的人工智能领域,而是“无心插柳”收获了对人类约定俗成的思维方式的全新颠覆。
结合《成长的边界》这本书的内容,我们可以把学习的环境分成两种类型。一种是友好型,有明确的目标和可遵循的规律,在这样的环境里,设立目标,努力实现目标,并且在过程中衡量进展,是我们大多数人遵循的常规操作。比如说,我想在XX时候完成一场半马。为了达到目的,设立计划并且执行,在友好型的学习环境这样的操作无可厚非。
另外一种学习环境是恶劣型,在这种环境里,目标模糊不清,没有清晰的反馈,也没有规律可循。比如说,前段时间有位学友问我,如何成为自己想成为的人,如何去探索人生价值,这个问题本身,就是一个非常开放而且没有明确路径的问题。就好像我们身处在一个浓雾弥漫的森林里,前后能见度不到一米,所以不知道如何走出这片森林。在这种情况下,不时地顺应偶然性,接受未知和变化,搭建自己的“踏脚石”,也许能得到出乎意外的收获。
实验一
在这本书谈到了一个非常有意思的科学实验,这本书也是因为这个实验而衍生的产品。这个实验叫做“图片孵化器”,作者通过一个程序来模拟动物繁殖的过程,选择的实验对象不是东西,而是网上的图片。科学家们设计了算法,每一张图片有自带的DNA。每两张图片会繁衍出下一代的图片,因为带了父母的DNA,所以子代的图片会带着父母本身的特点,但同时也带了自己独特的个性特点。用户们可以在网站选取自己喜欢的两张图片(也可以选择别的用户已经培育好的图片),生成的子图片会变成下一代图片的父亲或者母亲。作者惊讶地发现,经过了一段时间后,用户真的繁育出一系列很好玩的图片,海豚,汽车,阿菲尔铁塔。更加令人惊讶的是,用户最后繁育出来的图片,其实和一开始设定的目标完全不一样。
本书作者也参与了图片孵化游戏。他选取了酷似外星人的脸的图片作为父母,接下来有意思的事情发生了,最后孵化出来的作者完全没想到的是汽车的图片(下面的图片可以看到具体的对比)。在这个实验中,我们可以看到,一个用户的在网上发布的新图片,在不经意间启发了其他用户新的想法。所以本书的作者说,一切看起来都好像这么偶然。如果没有这个孵化网站实验的结果(外星人脸的图片),就没有偶然孵化出来的汽车,也没有作者受到启发会去思考和撰写这本书。
实验二
在机器人迷宫实验中,没有设立目标的机器人每次尝试做和以往不太一样的事情,机器人一开始有可能会撞到墙上。在新奇探索中,机器人撞墙的行为被视为是一种学习,而不是一件坏事。撞墙的行为是新奇的,接下来机器人会探索各种撞墙的方式。在接近足够多的撞墙后,有意思的事情发生,机器人不再撞墙,而是学会避开墙,最后走出迷宫。在我看来,这是一种基于过去经历学习,并且大量试错的过程。
实验三
书中还有另外一个实验,同样也证明了新奇探索的行为反而比目标行为更有可能获得成功。在40次的探索实验中,无目标的机器人在39次找到了终点,而基于目标的机器人,只成功了三次。
书中提到了一个术语“目标函数”,用来描述我们在当前点去到我们目标所剩下的距离。举个例子,作为父母,我们的目标函数可能是“如何提高孩子的成绩”以及“如何让孩子能又快又高质量地完成作业”,如果我们只盯着这两个目标函数指定计划从而进行优化,我们也许很有可能培养的出来是缺乏驱动力,甚至成绩可能也达不到父母的期待。当我们用所谓的目标函数去衡量孩子的进步的时候,这个不完美的函数很还有可能欺骗我们。再看我喜欢的陈忻老师,她不会把这些函数作为培养孩子的目标,而是花时间和耐心培养亲子关系,尊重孩子的发展规律,在孩子需要的时候给予帮助,在这种顺其自然的“无为”下,优异的成绩反而变成了养育孩子的副产品。
在我们的常规认知里面,未来好像一座灯塔,指引我们努力的方向。但是这座灯塔有时候具有欺骗性。例如,人类要发明飞机的灯塔,没有引导我们先要去搞定感应线圈。指引人类发明计算机的灯塔,也没有提示我们要去先发明真空管。
再次回到之前谈的图片孵化的例子,如果一开始我们想孵化出一辆汽车的图片,恐怕外星人图片的得分会非常低,甚至都不会有人去选这张图片。正如书中说的,我们无法看到事物背后的千丝万缕,我们也无法看到事物关键特征下的微弱的相似性。
在书中,作者打了比方,想象我们在一个“搜索空间”里面寻找绘画用的图像(相当于我们的设立的目标)。这个“搜索空间”就好像一个巨大的房间,有数万亿的图像在闪闪发光。房间里有些地方塞满了各种人像,有一个角落则是繁星点点的夜晚-梵高的《星空》,大部分空间则塞满了无用的东西。我们可以把创造的过程想象成在房间“搜索”的过程,我们可能描绘出来的图像,决定于我们浏览过的房间的区域,也可以理解成我们曾经经历过的事情。我们经历得越多,在这个房间能探索的事物就越多,成功的可能性就越大。在某种意义上说,“我们去过的地方,都会成为我们开拓新思想的踏脚石”。这里的绘画只是一个比方,也同样适用于写作,寻找自我,做产品,等等。所以,我们可以尽可能积累这个世界的相关信息。去阅读,去体验,去思考。
在迷宫实验中,机器人是不断去探索新的路线,这个实验给我们启发是,我们可以从自己有兴趣的事情开始;也可以尝试离开自己的舒适区,做一些没有做过的事情;还可以做一些觉得无用的事情,试一试,看看会发生什么。回忆我今年的上半年,我考了项目管理证书,我还自学了notion软件,做了两期播客,还有一期线上直播,组织了若干次群学习和讨论。做这些的初衷,纯粹是因为兴趣,因为“好玩”,我不确定这样对于未来的职业有没有帮助,但是我很享受这样看似随机的探索。这样的探索和信息收集的过程也源源不断地会给我反馈,作为一个个“踏脚石”,指引我下一步应该怎么走。
作者是AI研究者,我们知道AI的学习能力是非常强大的,在探索空间这个比方里, AI探索的速度远远大于人类。对于有限的人生,这种探索的容量能有多大呢?
对于新奇探索,其实也可以看成大量试错的,不断排除的过程。如果说目标探索是关注于未来,那么书中的新奇探索是关注在过去的经历。大量试错,对于AI学习是比较有效率的,但是人生的容错率有多高?有多少人愿意一直花时间去试错呢?最终又有多少坚持下来了呢?
基于以上的阅读中的两个探讨,我觉得这本书也许可以这么解读,我们需要看到发展的“长期主义”,现在看起来基于兴趣和新奇的探索,在我们有生之年也许看不出来什么价值,但是有可能变成几十年后或者几百年后的人类的“踏脚石”。 把这些踏脚石放到人类历史发展的长河中,我们也许能更加看清楚这些“踏脚石“带来的深远意义。我个人的一点思考,也欢迎大家在留言区留下你的思考。
参考资料:
书籍:《成长的边界》[加] 大卫·爱泼斯坦
播客:无人知晓 -E30 让奇迹发生