光在大质量处弯曲:N-body模拟与《三体》

文化   小说   2023-04-11 01:26   北京  

        2008年前后,我在某网站上读到网友转帖的《三体》,激动不已,废寝忘食读完,大周末早上起来,非要拉上妻子女儿,逼着她们听我讲一个特别激动人心的故事。后来,在微博上逐渐发现一些以ETO组织命名的博主,什么“三体_叶文洁”之类的名称,他们发的内容常常是有点儿cosplay ETO的模样,有点儿“三体亚文化圈子”的意思。2013年英特尔IDF峰会,我负责讲解Intel Xeon Phi众核服务器加速求解和模拟N-body N体问题的仿真。会后,我把展出公布在微博上,被科幻世界等大v转发引发轰动,成为我后续做《三体》读书科普的契机。

        三体问题,涉及三个物体通过引力相互作用的运动,是N 体问题的一个特例,用一组常微分方程 (ODE)表达。它没有通用的封闭形式解,只能通过数值计算来仿真,或求特解(例如,拉格朗日点或受限三体问题),某些条件下表现出混沌行为,其运动对初始条件的极端敏感性,初始位置和速度的微小扰动也会随着时间的推移导致截然不同的轨迹 - 2023年的电视剧《三体》中,在恒纪元和乱纪元之间混沌摇摆中的第N个三体文明在游戏中湮灭,都是为了解决这个混沌的方程。N-body N体问题,是三体问题的推广,处理 N 个物体通过引力相互作用的运动。随着 N 的增加,问题变得更加复杂,封闭形式的解仅适用于非常特殊的情况。采用数值积分的方法,如 Verlet Barnes-Hut 算法,来解决 N 体问题。对于三体问题,一般的Runge-Kutta Leapfrog 等数值积分方法,可以并行化在Xeon Phi众核处理器上运行。在一个Colfax的演示中,N-boday问题的单节点性能从 3.2 GFLOPS 提高到 2831 GFLOPS ,当工作负载分布在 16 个集群节点上时,性能提升至 33208 GFLOPS。从而在在亚秒级(~662 毫秒)的每个时间步,执行超过 1 万亿 (1,099,510,579,200) 次粒子间相互作用。

        Xeon Phi作为英特尔的众核加速产品,接下来助力天河2 超算斩获连续数届Top500的冠军。那个年代,AI大算力的应用还没象这些年爆发,Xeon Phi来得早了一些。英特尔《知in》就此总结了一篇技术科普 - “从《三体》看英特尔所引领的高性能计算超越

        我的第一次《三体》分享,是新智元前身静沙龙群主杨静组织的第二期活动,用1个小时浓缩讲完刘慈欣的《地球往事三部曲》,基本上形成了后续分享的两个风格 - 一是科技与人文的交叉思考,一个是纯物理和硬科幻的知识拆解。

        随后在2014年HPC China上,我第一次将科幻作品《三体》和HPC相联系讲了《三体和高性能计算》,吸引的听众挤满了后排的站位。在这次演讲中,我提到《黑暗森林》提到的世界上最快的计算机只有500万亿次浮点(flops),《三体》系列第一版出版于于2008年,而2005年地表最强超算的IBM蓝色基因已经达到500万亿次水平。如果不以《三体》出版年份而以小说时间线算,到面壁人的危机纪元,科幻对超算的想象差距就更大了,今天采用Intel SPR HBM和Xeon GPU Max的美国的Aurora超算,可以达到2Eflops科学的突飞猛进,已经远超同一时代的科幻想象力。随着IDF的传播,英特尔组织了三四次和科技媒体分享《三体》的讨论,直到我离职时举办了最后一次《三体》分享,参会的三体粉丝组成了一个“三体一号宇宙”的群,从15年底到现在仍然活跃,群友都有《三体》人物的化名,“罗辑”“丁仪”还时不时贴一些《三体》同人作品。我在里面的群名我都忘了,有一天“叶文洁”对我贴出的《三体》电视剧选角提问,才知道自己叫“章北海”。

        20158月《三体1:地球往事》获得第73届世界科幻大会雨果奖最佳长篇小说,从此《三体》传播速度开了挂。从15年到疫情前,在CCF和出版社、中国科技馆等组织的科普讲座上,我大大小小做了十几场围绕《三体》和计算相关的分享,内容更偏向硬科幻内部的科学概念。《三体》第一部英文版出来时,我推荐给当时英特尔的外国同事,他从没来过中国,买了书正好去sabbatical。读完之后给我回信说,第一,作为三部曲,只能看到第一本,另外两本还在等,真是很痛苦的事 (这个奥巴马也没办法,他也催着呢)。第二,这部作品里对WG的反思态度很值一读。然后问第二第三册有没有更多的讲WG的东西?我说实在抱歉,没有。直到2023年看到电视剧《三体》如实反映那个时代的人生与人心,心中一块石头才落地,想起总结《三体》的一句话:“ WG毁灭了太阳系!

        《三体》获奖前,在一些中学生中已经口口相传,获奖后,一些家长们看到如此大部头啃不动,于是有出版社朋友请我给家长们讲讲。一位家长说,之前发现自己的孩子暑假在偷看一部大部头,叫什么体,这还了得,大约仿佛必定是本坏书,再说还学不学习了,这么厚一本?没想到居然是中国科幻的突破之作。看到青少年读者越来越多,我这时候更多的分享开始围绕硬核物理学本身,不得不反复啃霍金的《时间简史》,一直到2021年围绕译著《格物致理》和《未来500年》引入天体物理、生命科学和宇航技术的烧脑探讨。不再谈那些科技与人性相关的话题,比如每次都有人围绕程心是否白莲花,圣母等话题讨论。这个话题很容易引起争议,大刘显然不喜欢程心,但《三体》了不起的是,一旦小说展开,人物就有了自身的逻辑,不由得作者的喜恶。这期间,《三体》组织的网友,寄来了他们制作的三体同人作品,十分出色。

        20165月,和几位老师专门去大刘写出《三体》的山西阳泉娘子关电厂,看到8-90年代三线建设风格的凋敝旧厂房,当时感慨:“  从山西娘子关电厂的某个角落,大刘那写出《三体》的大脑和心灵,写出了宇宙三体和人类的文明宿命的结局,命运展开硕大的披风,只有死神永生。” 201519年间,在各地不同场合的《三体》与计算的讨论中,自己对这部书的认识也不断刷新,以至于我的公众号《四维碎片》中有很多篇都是和这些讲座有关的总结,《三体》:科幻Vs.人性 - 武汉光谷创业咖啡,《中国科技馆-带你解读《三体》中的科技》等;

        过去的三年,除了阿里云高性能计算推动疫情中科研、影视上云的工作,和女儿合作翻译书籍,也算是借“两地书”派遣焦虑 (见青年报《一家三口,疫情三年四本译著问世》)。而其中的《未来500年》,简直是刘慈欣《流浪地球》的科学实现,也解答了《三体》中很多说不过去的硬科幻 - 如冬眠技术等等。这本书出来的时候,托大刘的朋友给他送了预印本,那时他在外地忙着《三体》电视剧的指导,出版时交错而过。

        22年底重回到英特尔,在ChinaSC超级算力大会上介绍英特尔针对HPCAI算力的至强CPU Max系列和数据中心GPU Max系列,最新的Aurora极光超算系统,将超过10,000Intel的板卡整合到 HPE Cray EX架构中。每个计算板卡都配置2Sapphire Rapids Xeon CPU6Ponte Vecchio (PVC) GPU,它们集成到带有Slingshot网络的HPE Cray EX架构中,提供超过2Exaflops (2 百亿亿次)的算力。讲到这些,我想起《三体》游戏里宏大悲壮的人列计算机,我也明白,尽管有了2E flops的算力,对于本质混沌的三体问题,我们仍然只能模拟,不能给出通用的封闭解 - 即便使用机器学习的方法。

        回头看看2008年出版的《三体II黑暗森林》中500万亿次浮点最快的超级计算机,以及2013年四连冠的使用Xeon Phi达到33.86千万亿次的天河2号超算,不禁感慨 - 技术发展如此之快,硬科幻作家的想象力已经一再落后现实的发展速度。

        从2008到2023,我在不同的场合分享科普和科技人文讲座,大都绕不开《三体》这个话题  —— 像光在大质量处弯曲。

* 题图与Aurora blade均出自HPCWire文章,文章中图由英特尔提供。https://www.hpcwire.com/2022/05/10/aurora-installation-underway-now-open-for-reservations/

四维碎片
当四维碎片经过时,它将透视一切时空细节,洞若观火。这里记录了在追求知行合一的道路上,那些思维碎片集成的文章,分享对技术和人生的观察,也分享读书,观影和一切无用,有趣,有价值事物的思考,君子敬而无失,与人恭而有礼,四海之内皆兄弟也!
 最新文章