复杂科学是一个跨学科的领域,它融合了物理学、生物学、计算机科学、经济学和社会学等多个学科的理论和方法,旨在理解复杂系统的行为和动态。而“规模法则(Scaling Laws)”是复杂科学中一个重要的概念,旨在描述不同系统和现象如何随着规模变化而变化的规律。这些法则在自然界、工程学、生物学、城市发展、经济等多个领域都有广泛的应用。
2024年11月15日,北京师范大学系统科学学院教授张江老师在西塘为我们带来了一堂关于规模法则的课程,以下是本次课程节选。
规模缩放法则
今天我们会看到有大量的数学定量公式可以去描述这个复杂世界背后所蕴含的统一规律,这些规律就是所谓的规模法则。正是有这些规律的存在,复杂科学才得以成立。
规模理论的提出者Geoffrey West,早年是一个纯粹的理论物理学家,由于家族的前辈们在50岁时出现了普遍的衰老乃至死亡,在其50多岁的时候,他也开始担心自己的身体健康问题,并将其当作一个科学问题来探索。
一个生命体的寿命长短是由什么因素决定的呢?他开始查阅大量的生物学文献,但是这些文献都没有办法直面回答他的问题。一次偶然的机会,他遇到了生态学家James Brown,James告诉他,从生态学的角度来说,这一问题的答案可能与“规模”相关。此后,二人开展了长达十年的合作,最终确立了规模法则,并将这套理论应用于公司企业、城市规划之中。
什么是规模法则呢?其英文为Scaling,又译为规模缩放法则。人类的大脑最习惯于进行线性思考,自然而然地认为一个十人规模的企业扩大到百人规模时,就能从赚一个亿到赚十个亿,而规模法则最为重要的特点就在于强调变化的非线性。一个生命体从小变大,虽然各个部位都会相应放大,但是放大的比例却不尽相同。两个四点五寸的披萨和一个九寸的披萨面积并不等同,是因为当披萨的尺寸增加时,其面积的增长速度是平方级别的。
科幻片中身高两三层楼高的巨型怪兽哥斯拉在真实的物理世界中是不可能存在的,因为它的双腿无法支撑起它的整个体重。如果把一个生命体抽象成一个立方体,体积的增长呈三次方规律,而截面积的增长则呈二次方规律。截面积越大,承受力就越强。随着生物体的增长,其体重的增长速率将远超承受力的增长速率。
规模法则也同样适用于大语言模型的发展。2020年,研究就发现,随着模型参数的扩大,一系列的性能指标都会出现不同比例的变化,代入公式就可以进行外推,人工智能系统在未来能够达到什么样的水平。这也是Open AI笃定大模型的方向,并应用于科技创新的原因。
生命体中的规模法则
上百年来,科学家们对于复杂系统的研究形成了一定的科学范式。第谷进行了长达20年的天文观测,亲手在笔记本上把观测的数据记录下来,形成了非常珍贵的手稿。在临终前,第谷把记录了20年的数据手稿交给了开普勒,将行星运行背后的原理性问题留给了他解决。开普勒在进行了几年的研究之后,跳脱出行星沿圆形轨道运动的看法,结合数据总结出了行星沿椭圆轨道运行的规律,提出了著名的开普勒三大定律。牛顿应用他的第二运动定律和万有引力定律,在数学上严格地证明了开普勒定律。
事实上,这三个人就代表了自然科学发现的三个阶段。第谷代表的是第一阶段,即数据收集阶段。开普勒代表的是第二阶段,即唯象阶段,用一套数学原理去解释观测到的数据。比如开普勒三大定律就完美解释了第谷观测了20年得到的数据,揭示了太阳系中行星的运行规律,但局限在于其无法推广到别的星系。牛顿代表的是第三阶段,即原理阶段,代表着事物发展的底层规律,可以应用在更广的范围中。
规模法则处于第二阶段,反映生物系统中的规律的“克莱伯法则”F=cM^3/4被我称为“生物界的开普勒定律”。从单细胞内部的线粒体到鲸鱼大象,克莱伯定律适用范围横跨了20个数量级。这条规律表明,生物体的代谢水平与体积大小之间具有正相关性。当一个生物体的体重增长了十倍,其代谢水平则以一个相对较慢的速度增长,大概在八至九倍。体重越大的物种,每个细胞的代谢水平就越低,能力利用率就越高。
由于代谢是生物体不断进行物质和能量交换的过程,因此和生物体的表面积关联较密。从几何的角度看,表面积和体积的2/3次幂成正比,然而,代谢率与体重之间并非2/3次幂的关系,而是3/4次幂的关系。到底是哪里出错了呢?研究发现,我们的世界不仅仅停留在三维的层面,生物体的褶皱分形构成了一个四维的空间。我们的大肠表面大量的毛细血管网络,植物、动物和单细胞里面的细胞骨架,都构成了所谓的分形几何体,正是这些分形几何体导致了四分之三幂律。
克莱伯定律就告诉我们一个道理,不要盲目进行线性外推,而这是一个连顶尖科学家都会犯的错误。在上个世纪六十年代,科学家对一种名为LSD的毒品展开了大量的实验研究,并测算出猫的安全剂量为0.1毫克每公斤,他们依次推测一个体重为3000公斤的大象的安全剂量为300毫克,并少注射了3毫克进入大象体内。结果,实施注射5分钟之后,大象开始大叫起来,轰然倒地,并进入持续癫痫状态,在1小时40分钟之后便死亡了。
同样地,我们平时吃药也要谨遵医嘱,不能线性地外推。2岁的小孩大概12.5公斤,服药的剂量为一包。7-8岁的小孩体重是2岁小孩的两倍,但是服药的剂量却小于两包。而医生给病患开药的时候,已经考虑到了年龄、体重等因素。
人类怀胎十月生出宝宝,而小猫怀孕可能两三个月就能生下一胎。生命体的特征时间T与体重之间也有规律,为1/4次幂的关系。另外,生物体的特征频率f,即心跳频率与体重也有关系,为-1/4次幂的关系。把这两条规律结合在一起,还有一个令人震惊的发现:当生命体的特征时间与特征频率相乘时,会得到1.5*10^9这个结果。这就意味着,生命体一生的心跳次数是一个恒定的常数结果。体重大的生命体寿命较长,但是频率就相应地变低了;体重小的生命体寿命较短,但却有较高的频次,冥冥之中自有定数。
从克莱伯定律和能量守恒等基本原理出发,可以推导出生物体从出生到死亡体重变化的过程,即生长曲线。这一过程可以抽象为一个水缸模型:生物体的体重就相当于水缸中的水量,体重的变化则可以视为水的注入和流出带来的结果。代谢水平对应的是水的流入量,维持生命活动所需要的能量代表的是水的流出量。
生物的代谢与体重的3/4次幂成正比,因此呈弯曲形态。随着体重的增加,代谢流量增长逐渐减缓。生物的维护成本与体重成正比,因此呈直线状态。随着体重的增加,维护流量始终以固定速率增长。生物的生长就发生在流入量高于流出量的时候。
这一生长曲线的普适性进一步被验证:不同物种的生长数据,都能在同一曲线上找到对应位置。规模法则在生物界的作用就类似于开普勒定律在天文学中的作用,能够有效描述生物体生老病死的实证数据。
企业中的规模法则
企业是经济系统的基本单元,规模法则是如何在企业中体现的呢?
规模法则可以用来分析企业销售额与员工数之间的关系。根据2008年美国300多家上市企业的数据形成了一张散点图,一个小点就代表一家企业,其中横坐标为企业员工数、纵坐标为企业销售额。通过线性拟合可以得到一个方程,这个方程中最关键的是x前的斜率1.02,反映了企业规模与销售额之间的增长关系。这意味着美国上市企业的员工数量增加两倍时,其销售额大约会增加两倍多一点,大公司与小公司的销售能力差异不太大。我们根据3000多家中国企业的数据得出来了的斜率数值仅为0.83,明显小于1。这意味着在中国,企业规模翻倍时,销售额增长不到两倍,大公司比小公司的人均销售额低。方程的系数代表的是单人的销售额,是一个企业只有单一员工时的销售额。中国企业的规模法则系数大于美国,则意味着中国企业的单人销售贡献高于美国企业。
规模法则还可以揭示企业老化的现象。我们依然采用的是企业销售额和员工数这两个指标,但是选取的样本有所不同。我们在1950年到2023年这长达70年的跨度内,选取了所有创业时间只有一年的企业,对于这些初创企业而言,企业销售额和员工数之间的斜率提高到1.07了,具有更强的规模效应,规模扩张时销售额增长的速度更快。这也意味着,创业初期的企业增长潜力巨大,能够实现快速突破。
我们还可以进一步研究不同年龄段的企业的表现,分析企业在10岁、20岁、30岁等不同年龄阶段的斜率变化。同时,我们还可以考察销售成本、管理成本等各类指标,绘制出不同的增长曲线,这些线条的斜率变化就揭示了企业随着时间推移时的不同表现。随着企业年龄的增长,企业的研发成本和管理成本越来越高,带来巨大的消耗,导致企业的效率降低,呈现出典型的老化现象。
规模法则还可以用来直接对企业进行评估。我们提取了规模法则中一个叫作离差的指标,根据收集到的数据对企业进行统一的评估。在一个横坐标为总资产、纵坐标为总负债的坐标系里,我们可以看到A、B、C三家企业的整体资产规模和负债规模。直观来看,C企业的负债最高,似乎是最不理想的。然而,单纯根据总负债评估企业是不准确的,因为负债高的企业往往资产规模也更大,尤其在中国,大企业往往更容易获取资本。为了更加合理地评估企业,我们引入了负债率这一指标,斜率越高,负债率越大,企业经营状况就越不理想。
我们还提出了一个全新的指标,对于中国企业实际遵循的规模法则而言,总负债和总资产之间呈1.09次幂的关系,是一个幂指数大于1的非线性方程。负债水平和资产规模的偏离程度直接影响对企业好坏的评估结果。若企业处于曲线之上,则意味着负债过高,表现较差;反之,若处于曲线之下,表现较好。
我们可以利用规模法则分别结合负债率、成本、利润等拟合出一条直线,并用离差,即企业偏离直线的距离来评估每家企业的经营状况。对于如销售额和利润这样的正向指标,偏离曲线越大越好;对于如负债这样的负向指标,则偏离曲线越小越好。利用这一创新指标,我们对美国300多家上市公司和中国3000多家上市公司进行了数据分析,对离差指标与传统的比例指标进行对比,从而为企业评估提供了一种新的视角。
我们进行了一项大规模的实验,对时间跨度长达70年的美国企业数据进行分析,通过利用离差指标评估企业的破产概率,来检验离差指标的预测能力。实验证明,我们的离差指标比原有的比例指标用来预测企业的未来表现要更加可靠和合理。
那么,企业的发展到底有没有规律呢?如果以时间为横坐标、总资产规模为纵坐标来观察北美企业的数据,这些小点呈现出的似乎是无规律的上下起伏和波动,但是如果你仔细地观察就会发现,这些小点形成的曲线表现出了缓慢的增长趋势,恰好与美国2~3%的GDP增长率相吻合。
然而,这只是表面现象,真正的规律蕴藏在不同视角下对数据的特殊处理。当我们改变视角,将横坐标选取为总资产,所有的数据点呈现出强烈的规矩性,形成了一条几乎完美的直线。之前我们提到生物体代谢率和体重之间存在着稳定的关系,企业的净收入和总资产的斜率为0.85,展现了类似于生物体中的克莱伯定律。
基于这个定律,我们可以推导出企业周期、运动频率等一系列要素与企业规模之间的关系。随着企业规模扩大,资金的周转频率和人员周转频率会降低。企业的寿命越长,平均而言,员工在企业中停留的时间就会越长。
在企业中的水缸模型里,流入水缸的部分有两个项目,一是净收入,二是贷款,流出水缸的部分是企业发展所需的各类成本,构成了企业的财务平衡方程。财务平衡方程和规模法则这两个第一性原理结合在一起,就推导出来企业生长方程。我们可以看到对于美国大多数的传统企业,如可口可乐,其增长曲线与这个生产方程能够很好地吻合,但是企业毕竟不是生物体,其成长受市场约束和个性化因素的影响,像苹果这样的高科技公司,往往就因被投资者看好、获得大量资金支持,而偏离正常的增长轨迹,增长速度明显高于市场平均水平。
在中国,也有百分之六七十的企业的增长曲线是与这个方程相吻合的。中国和美国的企业增长曲线之间存在着一个巨大差异:美国企业的增长曲线趋于平稳,而中国企业的增长曲线在上涨之后会有微微跳起的趋势。这一差异的原因在于中国企业的借贷模式,中国企业总债务与总资产的斜率是1.09,且公司越大,负债率越高。在美国则不会有这种现象,大小公司的负债率都差不多。
城市中的规模法则
为什么我们要关注城市?全球超过50%的人口都已经居住在城市之中了,城市化进程日益加快,特别是中国,许多小县城已经转变为初具规模的小型城市。随着城市化水平的提高,城市的发展也逐渐展现出两面性,一方面是城市的辉煌和繁荣,另一方面则是环境污染等负面要素。规模法则就可以帮助我们去研判在城市的发展过程中,其财富水平、科技创新等方面会发生何种变化。
当我们去看张家口、石家庄、北京这三座城市,是否可以说北京就是一个放大的张家口或者扩大的石家庄呢?这是我们思考规模法则的起点。以500多个美国城市的实证数据为基础,我们将城市总人口作为规模指标,分析城市GDP的变化。数据显示,城市规模与GDP成正相关关系。城市每扩大1倍,GDP会扩大1.13倍。这就是现在很多年轻人愿意留在大城市的原因,因为随着城市规模的扩大,人均GDP在上升,尽管大城市同时也伴随着犯罪率、疾病风险较高的问题。
规模法则涵盖了众多指标,且在不同国家的城市中都呈现出类似的规律。城市不仅是人口的聚集地,也是基础设施的载体。以美国城市为例,其道路总面积与城市规模的0.85次幂成正比,这得益于大规模城市的高联动性,共享道路面积大,因此对于道路面积的增速没有较高的需求。
规模法则中的方程指数可以分为三类:大于1、等于1和小于1。指数大于1的通常是与人类交互密切的指标,如GDP、科技创新、专利数量、犯罪率等等。这意味着城市越大,人均的积极性越高、专利数越多、犯罪率越高。指数小于1的则是与各类基础设施相关的指标,如加油站数量、城市管道长度等等。这意味着随着城市规模扩大,人均基础设施的数量逐渐减少。指数等于1的是与人口数相关的指标,如平均用电量等。
我们提出了一个模型去解释为什么城市中广泛存在规模法则,出发点是人是城市的主体。城市中的人口不是固定的,除了睡觉的时候,绝大部分时间都在流动。因此,我们提出了“活跃人口”的概念,代表着城市中流动的人群,白天可能体现为工作人口,夜晚则转化为居住人口,将二者平均混合即可得到相应的活跃人口。
我们将活跃人口作为建模的基本单元,遵循匹配生长的原则。一个城市可能起源于一个小渔村、小社区,后来会不断有代表活跃人口的节点,即活跃社区加入,新加入的节点只有在与现有节点足够靠近的时候,才会被认为是有效的加入。有效加入的节点才能够生长,形成中间密集、两边稀疏的人口分布模式,这与真实的城市数据非常吻合。
城市不仅要聚集人口,还需要形成创新的力量。那么,创新从何而来?创新并非是刻意需要伟大的发明抑或理论,从大尺度看,它和随机的化学反应类似,是人和人之间思维的随机碰撞。所有创新和财富创造的根源都在于人和人之间的互动。很多城市中的咖啡屋、车库空间,就是为人们提供了交互的空间,从而催生科技创新,形成财富。
人口不是孤立存在的,而是彼此之间形成交互,从而构成一个简单的网络。随机形成的交互网络,与节点数成二次幂的关系,但这一交互网络并没有考虑到人与人之间交互的成本。在实际生活中,人们的交互会受到物理距离的限制,特别是在没有现代化高速公路的过去,人们的活动范围非常局限。
在现代化的城市里,我们的交互模式显然不是随机的,但也不像网格般规整,高速公路的蓬勃建设使我们的社交网络得以跨越空间。我们假设所有的人类交互形成的创新和财富创造都沿着路网进行,这说明道路路网与经济活动之间有着非常密切的联系,路网构成了我们人类经济活动的界面。
人类活动的节奏与城市规模也有关系。研究发现,城市规模越大,人们的步伐会越快。在北京、上海这样的大城市,上班高峰期地铁里拥挤不堪,人们都行色匆匆,慌里慌张。在伦敦,还会有专门的快速通道,让人们得以快速通过。同样地,城市规模越大,手机的使用频率越高,人们的沟通强度越高。大城市迫使人类生活节奏加快,变得越来越繁忙,这也是规模法则的推演和体现。
刺猬是我特别喜欢的一个摇滚乐队,他有一句歌词叫“社会是伤害的比赛”,我深有体会。当人和人之间形成互动时,除了会带来创新想法和财富来源,还会带来矛盾和摩擦。因为人际关系的发展背后是熵的产生,城市发展到一定程度,一定会将这些产生的废弃物排出去,在数据上即体现为二氧化碳的排放会随着城市规模的扩大而增加。
与生物体和企业一样,我们也可以为城市建构出一个水缸模型,方程指数为1.15。但与其它二者不同的是,基于初始条件和参数设置的不同,城市增长存在着两种可能性:一是实现超速度增长,在有限时间内形成人口的超大规模爆发;二是伴随着人口增长产生的大量垃圾无法消化,基础设施建设跟不上需求,整个城市遭遇发展瓶颈,乃至完全崩塌。
为了调节这两种可能性,研究者又推导出来一个波浪式的城市增长规律。人类历史上众多城市曾面临消亡,但科技革命的出现遏制了这一趋势。换句话说,创新不是原因,而是结果。城市发展的一角在崩塌,于是人们不得不寻求新的突破。科技创新就会改变城市发展的方程系数,提升人们的幸福感,使得城市发展迈入了新的轨迹。
周期性的崩溃和重建并非无序,而是遵循着一定的定量规律。科技迭代的周期越来越短,从最初的上百年缩短至几十年,再到现在只需要几年。用跑步机来做比喻,人们不仅是在跑步机上奔跑,而且还会不停地跳到更快速的跑步机上奔跑。当我们玩命地加速,不停地切换到更快速的跑步机上,就会面临一个不可回避的问题:最终哪里是终点?
科技进步的不断加速是在接近人类历史中的技术奇点,一旦到达奇点,超级人工智能和环境崩溃可能同时发生。问题的根源就在于我们刚才所说的,交互是一个伤害,一切互动都伴随着熵增加。老子在《道德经》中所形容的理想国,“邻国相望,鸡犬之声相闻,民至老死不相往来”,似乎是暗示我们停止或减少人类间的交互,但这并不意味着我们要退回原始的生活模式,人类无法一直停滞不前。