基于模型的推理实践:历史范例

学术   2024-10-06 13:12   上海  

片来源视频号 -流光溢彩Z 秋摄新西兰 - 提卡波 2024 (视频截图)

资料来源Nancy J. NersessianChapter 2 Model-based Reasoning Practices: Historical Exemplar. In Nancy J. Nersessian, Creating Scientific Concepts. The MIT Press, 2008.

作者介绍Nancy J. Nersessian 是佐治亚理工学院的Regents教授和认知科学教授。她的研究领域主要是科学哲学、科学史和科学心理学。

阅读难度:5 (阅读难度为5级,第5级为最难。目前等级设定完全是主观的)



历史,如果被视为不仅仅是轶事或年表的存储库,可以对我们现在所拥有的科学形象产生决定性的转变。——托马斯·库恩(Thomas Kuhn),《科学革命的结构(The Structure of Scientific Revolutions)》


在本章中,我考察了科学史上最重要的问题解决事件之一,即James Clerk Maxwell(詹姆斯-克拉克-麦克斯韦)首次推导电磁现象的场方程(field equations for electromagnetic phenomena)。在这里,一种全新的表征结构进入了物理学:对力的定量场表征。借此,早期关于电和磁场过程的推测被转变为一个科学上可行的概念。


在Maxwell的分析之前,关于力的表征有两种:(1)作为一种距离作用(包括“势”场,这是一种用于计算作用于距离力的数学工具);(2)作为通过物理介质(如水或弹性固体)连续传递的力。即使在第二种情况下,潜在的力也被假定为牛顿力的实例,在介质的粒子之间以距离作用的方式存在。Michael Faraday(迈克尔-法拉第)提出了电和磁力的定性场概念。他更倾向于将这些力解释为通过连续作用过程在空间中传递,而不需要任何牛顿介质(Newtonian medium)。与Faraday所偏爱的假设相反,Maxwell则从假设这些过程是第二种类型的力开始,认为它们是通过一种准物质机械介质——以太(aether)传递的。在这里讨论的问题解决过程中,他为场过程提供了一种数学表征,如果正确的话,这将证明电磁力是以时间延迟的方式传递的,因此,需要用场的概念来描述和解释这些力。


与Maxwell本人所认为的相反,他的分析并没有将电磁学的场表示整合到牛顿框架中,作为上述(2)中的一个实例。相反,他为力提供了一种新的表示形式的数学表达。回顾来看,我们认为Maxwell对这一问题的解决具有历史意义(历史性创造),因为他构建了一个非牛顿动力系统的定律。正如我们所知,他的工作为后来的相对论和量子力学带来的根本性变革开启了大门。我在以前的文章中以更具历史性的角度讨论过这个案例。在当前的语境中,我对它的兴趣在于提供一个基于模型推理(model-based reasoning)引导概念变化的典范。通过研究Maxwell的建模实践,我们可以深入了解创造力的一个核心问题:既然我们必须从现有的表示出发,那么如何可能创造出真正新颖的表示?在Maxwell的案例中,问题可以表述为:从机械动力系统的表示出发,Maxwell是如何推导出代表非机械动力系统的定律的?Maxwell的电磁场方程与牛顿力学是不一致的。换句话说,这些场方程无法映射回Maxwell用来推导这些方程的模型所在的领域


人们可能将Maxwell的做法解读为类比推理(analogical reasoning),但我将讨论的实践与哲学或认知科学中现有的类比推理解释并不完全一致。他并没有现成的源域解决方案可以映射到电磁学目标域。相反,他通过构建、操控、评估和调整概念模型来进行推理,这些模型被用于表示所研究现象的显著特征。他构建的模型是两者域的想象性混合体。类比域为模型的创建和调整提供了约束条件,这些约束条件与来自目标域和模型本身的约束条件相结合。他的推理充分利用了心理和外部表示。最后,要理解他的推理过程,比如他如何得出源类比(source analogies)的问题,也需要将其视为在特定问题情境中发生的。


Maxwell(1861-1862)将分析分为四个部分。第一部分涉及磁现象,第二部分涉及电流和电磁现象,第三部分处理静电,第四部分展示了该模型如何解释磁作用对偏振光的影响。本文讨论了第一至第三部分,这些部分发展了模型并推导出了方程。我的目的是首先尽可能有力地支持这样一个假设:建模实践生成了这种表示。然后,我简要讨论了这些实践如何可能具有生产力的想法,具体展开将在第三章的第二个范例之后进行。


Maxwell的问题情境


尽管我们的重点是个体的推理过程,但正如我之前所论述的,将建模实践解释为孤立发生的——脱离了构成Maxwell问题情境的社会、文化、物质和认知背景——是错误的。要理解他的问题解决过程,我们必须将其视为嵌入在一个丰富的社区实践网络中,而这些实践提供了他研究中使用的概念、分析和物质资源。为什么他从连续作用的角度出发研究电与磁?为什么他构建了类比模型?他为什么选择某些类比的源域?这些问题只能通过理解他的问题情境来回答。


Maxwell的方法源于他所处的环境,即他生活、受教育、教学和进行研究的地方。苏格兰几何学派在数学应用上的方法,以及剑桥的连续力学方法对物理问题的处理,构成了影响他如何构建问题和解决问题的理论、实验和数学知识以及方法论实践的背景。其中,Michael Faraday和William Thomson(后来的开尔文(Kelvin)勋爵)的工作对这些影响最大。同时期大陆的物理学家,如Andre Ampère(安德烈-安培),在电磁学上的研究采用了截然不同的实践,并依赖于根本不同的理论假设和数学、物理表示结构(参见,如Hoffman 1996)。这些物理学家未能推导出场方程的原因之一与他们的问题情境的不同有关。详细讨论Maxwell的问题情境中可用的所有资源可能需要另一本书,因此这里只列出了一份简要清单,说明那些对他构建场方程起了重要作用的资源。关于其中一些资源的更深入讨论,可以参考《从Faraday到Einstein》(Nersessian 1984a)以及以下引用的各种文献。这些资源特别包括:

1. 苏格兰和剑桥传统中流行的几何(物理和视觉)数学方法(Davies 2000)。

2. Faraday的实验研究、建模实践和理论解释(Faraday 1831-1855; Gooding 1990; Nersessian 1984a, 1985)。

3. Maxwell和他的同事在剑桥开发的用于连续力学现象的宏观数学分析技术,特别是用于分析宏观结构的偏微分方程,而不是通过粒子间力的微观求和(积分技术)(Buchwald 1985; Siegel 1991)。

4. Thomson基于偏微分方程和势理论对静电力线的分析(Thomson 1845)。

5. Thomson的“数学类比”,表明弹性固体中的线性和旋转应变力的分布与电磁力的分布是类比的(Thomson 1847)。

6. Thomson在介质中假设的涡旋,用于解释偏振面旋转的旋向(Thomson 1856)。

7. Thomson的类比法。

8. 关于热的研究,尤其是Thomson(1851)的“动力学”热理论,其中“动力学”指的是由系统内部运动引起的力,而非粒子间的吸引和排斥。这假设了分子个体的旋转运动,William Rankine称之为“分子涡旋”,是Thomson在1856年论文中为磁介质假设涡旋运动的来源(Crosbie Smith and Wise 1989; Siegel 1991)。

9. 最近提出的能量及其守恒概念。

10. 远程作用理论家如Ampère和Wilhelm Weber的电磁理论。

11. Maxwell早期关于力线的运动学论文,以积分方程为基础进行了几何分析(Maxwell 1855-1856)。

12. 渗透于维多利亚文化中的各种机械,例如蒸汽机和Charles Babbage的分析引擎(Crosbie Smith and Wise 1989)。


Maxwell 1861-1862年的论文标题《论物理力线(On physical lines of force)》直接引用了Faraday关于力线现实性的推测。在他的研究后期,Faraday区分了纯粹几何概念下的力线(Faraday 1852a)和作为物理实体的力线,其各种运动构成了自然界的所有力(1852b)。他将这些论文发表在不同的刊物中,以清楚地区分他认为是推测性的观点(物理力线)与那些通过实验确立的观点(力线的几何构型)。在1855-1856年的论文《论Faraday的力线》中,Maxwell对力线的几何构型进行了运动学分析。而在1861-1862年的论文中,他明确表示其目的是对力线的产生进行动力学分析,即分析产生力线构型的以太中的电力和磁力。在开篇的文字中,Maxwell直接提到了Faraday关于力线的磁性描述,力线代表了空间中某一点的力的强度和方向。Faraday的描述为Maxwell提供了多个电磁作用的视觉和模拟模型。


Faraday曾经尝试通过实验和理论来表达Oersted及其他人的推测,即围绕物体和电荷的区域中的物理过程可能对它们彼此间的作用有所贡献。在Faraday的实践中,构建并从视觉模型中推理是重要的方法。Faraday曾假设,当铁屑洒在磁铁和带电物体周围时形成的力线,表明在这些物体周围的空间中存在一种真实的物理过程,这一过程是传递作用的一部分(Faraday 1831-1855)。例如,铁屑在磁源周围形成几何构型的视觉展示,对Faraday对于电磁作用、力和物质的理解产生了深远影响。图2.1展示了实际力线(lines of force)构型的板图,图2.2展示了Faraday对条形磁铁周围力线的示意图。


图2.1 各种源周围的实际力线模式。Faraday,1831-1852年,第三卷,图版III


图2.2 Faraday的力线图。Faraday,1831-1852年,第一卷,图版I,系列1,图25


我在早期的研究中(Nersessian 1984a, 1985)曾论证,随着Faraday理论的发展,这一图像不仅代表了力线的几何形状,还构成了其作用的动力学模型。该模型是动态的,尽管纸上的视觉表现是静态的几何图案,但Faraday将其视为代表动态过程(参见Gooding 1980, 1990;Tweney 1992)。例如,他设想自然界的各种力量表现为力线中的运动,如摆动、弯曲、拉伸和振动。在他对力的完整概念中,所有自然力通过力线的各种运动统一并可互相转化,物质则作为汇聚的力线的点中心。


在他研究的最后阶段,Faraday引入了另一个视觉模型,这在Maxwell的工作中发挥了关键作用。他通过一个图示来表示电与磁之间的相互转化,这个图示展示了曲线以直角相互交错,如图2.3所示。


图2.3 Faraday的互锁环;Faraday,1831-1852年,第三卷,图版IV,图1


这个视觉模型表示电与磁之间的动态平衡;即“看似两种力量或力量形式的统一状态”(Faraday,1831-1855年,第三卷,第3268段)。也就是说,当一个环扩展或收缩时,另一个则进行相应的运动。


该模型是对两个先前模型的抽象,这两个模型也以视觉形式表示。首先,如图2.4所示,在力线模型中,平衡体现在磁力线的侧向排斥上,这与电流线的纵向扩展具有相同效果,而纵向收缩则与电流线的侧向吸引效果相同。其次,它源于Faraday在发现电磁感应后几个月所做的一个中间草图,如图2.5所示,Faraday在试图理解电、磁和运动之间的动态关系时在日记中绘制了该草图。


图2.4 我对磁力线和电流线之间相互关系的示意图


图2.5 Faraday对电、磁和运动的统一表示;日记条目,1832年3月26日


这里的平衡在于它们的相互作用。在出现的讨论中,Faraday评论道,这应被理解为一种动态表示,允许多种组合,其中任何一条线都可以代表电、磁或运动。


Maxwell关于电和磁的第一篇论文(1855-1856)为Faraday的“量”(沿着线的磁力总和,与区域内的线密度相关)和“强度”(与线的张力相关的磁力)提供了数学表述,分别称为“通量”和“流动”。他用连续函数取代了Faraday关于强度的离散测量,后者以“切割线的数量”来表示。Faraday的动态平衡模型体现在图2.3中,Maxwell称之为“相互拥抱的曲线”(Maxwell 1890a, 1:194n),这一点在Maxwell的场的数学表述中得到了体现。他为电力和磁力各使用了两个场——一个用于“强度”(力),一个用于“量”(通量),从而产生了八个方程,而不是现在常见的四个方程。Norton Wise(1979)对此视觉模型在Maxwell分析中的作用提供了有说服力的解释。Wise还建议,心理模拟这一图像可能为Maxwell提供了电磁作用传播的模型。如果想象将图2.3中相互锁定的两个环扩展为一个链接链,这样的效果就会逐步传播与电场和磁场相关的量和强度的总结。因此,“相互拥抱现在成为了子孙繁衍的源泉”(Wise 1979, 1316)。然而,重要的是要注意,在Maxwell的分析中,力的传播既不是沿着力线,也不是通过力线,而是正交于它们。


在设置1861-1862年的分析时,Maxwell想象了一个实验,直接将他的动机与Faraday关于物理力线的概念联系起来:“如果我们在靠近磁铁的纸上撒上铁屑,每个铁屑都将通过感应被磁化,连续的铁屑将通过它们的相反极结合,从而形成纤维,这些纤维将指示力线的方向。这个实验所提供的磁力存在的美丽插图,自然使我们倾向于将力线视为某种真实的东西”(451,原文强调)。Maxwell还提到了他朋友和老师Thomson(Thomson 1847)的论文,其中Thomson构建了以太与受压弹性介质之间的类比,以表示介质中电、磁和电流力的大小和方向。Thomson的分析纯粹是几何的。Maxwell在1855-1856年的论文中已经跟随Thomson,使用类比模型来解决表述问题。在与Thomson进行的广泛通信中,Maxwell承认他对Thomson的“物理类比”方法的债务,甚至表示相信Thomson可能预见到他的一些结果(Larmor 1937,17-18)。根据Maxwell的说法,物理类比是一种“调查方法,它允许思维在每一步都能够抓住一个清晰的物理概念,而不必致力于任何基于物理科学的理论,这种理论是从该概念中借来的”(Maxwell 1855-1856,156)。一种“物理类比”是“一个科学的法律与另一个科学的法律之间的部分相似性,使得它们各自可以阐明对方”(同上)。


正如Howard Stein所指出的,“在Maxwell的意义上,‘类比’是一种同构,是形式的等价关系”(Stein 1976,35)。然而,这一点可以说是关于Thomson构建的许多类比,例如热与静电之间的类比:在理解Maxwell如何能够创造出一种根本新颖的表述时,关于物理类比有一个重要的区别。正如Maxwell在给Thomson的信中所写:“我打算借用它一段时间……但以一种稍微不同的方式应用它”(Larmor 1937,1855年5月15日,第11页;另见1854年11月13日和1855年5月18日的信件,第8,11页;以及1855年9月13日的信件,第17-18页)。这种区别在于,Maxwell将可以被视为类比的源领域并不用于提供现象之间的直接映射,而是作为约束的来源。这些约束被融入到虚构模型中,这些模型是源领域与目标现象的混合表述。然后,该模型自身成为一种类比源,并在其机械解释与其电磁解释之间建立同构映射。我将在详细阐述Maxwell建模过程的具体细节后,进一步讨论这些区别。


Maxwell的基于模型的推理实践涉及通过抽象和整合各种约束的过程来构建、评估和调整模型这些约束在本质上是经验的、数学的和理论的。它们来源于多种来源:连续介质力学和机械力学的领域、在电和磁中的实验发现、数学,以及Faraday和Thomson的各种假设。一旦Maxwell形成了一个令人满意的模型来表示特定机制,他就会考虑机械模型中能够解释电磁现象的抽象关系结构,制定抽象模型的方程,并将电磁变量代入其中。论文中提出的每个模型都用于解决问题的一部分每个模型都在前一个模型的基础上构建——尽管不是以完全连贯的方式。与下一章中开发的S2协议示例不同,没有可能被丢弃模型的记录。目前尚不清楚Maxwell究竟写下了多少草稿,因为一场火灾摧毁了他的大部分记录。仅剩的计算片段——表明一些替代考虑——现已在他的《全集》中出版(Harman 1990,1995)。


在呈现这个案例时,我不会具体说明构建这三个模型时使用的所有约束,而是提供一个精简版本,专注于那些对理解模型构建过程最为重要的约束。与我们当前的理解相反,电流和电荷被视为介质中应力的结果,而不是场的来源。这在Maxwell方程的形式中得到了反映,在这些方程中,场量出现在等号的右侧,而不是像现在的惯例那样出现在左侧。


Maxwell的建模过程


在这一部分以及第3章中的S2案例中,我分析了建模过程,以突出构建、操作和调整中涉及的各种约束。在此过程中,我的目的是使目标、源和模型对这些推理过程的贡献显而易见。在这些示例中,通过整合各种约束,出现了新的表述结构。


模型1:涡旋流体

Maxwell的初始约束(I)源自他的背景目标和假设,与上述问题情境中的资源密切相关,尤其是他对这些资源的理解,包括Faraday和Thomson的实验、理论和数学结果。他首先引用了Faraday关于磁性的论述,Faraday的1855-1856年论文提供了对力线之间几何关系的运动学分析。相比之下,他1861-1862年论文的目的是提供对介质(电磁以太)中张力和运动如何产生观察到现象的潜在机制的动力学分析。他表达了希望通过这项研究能得出统一的电、磁和电流在电磁介质中产生、传播和相互作用的理论。作为支持,他引用了Thomson在1847年的论文,Thomson在其中将以太解释为在应力下的弹性介质,以表示介质中电、磁和电流力的大小和方向。基于此讨论,初始的全局约束(global, constraints)(I)包括:

I1:数学表述应提供电力和磁力产生与传播的统一解释

I2:这些力在一种机械媒介中连续传递,即以太。


鉴于Maxwell问题情境中的这些限制,连续介质力学显然是建模电磁以太的源领域(S)。流体流动、热量和弹性等连续作用现象最近都在与牛顿力学一致的动态分析中得到了数学表述。这项工作主要在剑桥大学进行,Maxwell对此做出了重要贡献。这些分析的假设是,介质中的微观作用距离力负责宏观现象。连续介质力学分析是在宏观层面进行的,力的传递被视为连续的。初始的约束导致假设在连续介质力学相关领域成立的动态关系在电磁学中也将成立。


目标约束(target constraints)(T)是指特定于电力和磁力的约束。Maxwell提到的初始目标约束源自Faraday的实验以及他和Thomson对此的解释:

T1. 力线之间存在张力。
T2. 力线之间存在横向排斥。
T3. 电力和磁力的作用相互垂直。
T4. 磁力的作用会使偏振光平面旋转。


Maxwell首先讨论了介质中应力的一般特征。应力源于介质相邻部分的作用与反作用,“一般由在介质同一点上不同方向的压力或张力构成”(1861-1862,454)。在初始约束 I2 下,可以假设电磁现象的原因是以太中的应力,因此可以假设连续介质力学(如流体和弹性固体)领域中成立的动态关系与电磁现象之间存在“形式上的相似”。在考虑能够容纳目标约束的连续介质力学中应力的性质时,Maxwell推断出可能的源约束(source constraints)

S1: 力线方向上存在张力。

S2: 赤道方向的压力大于轴向的压力。


源约束 S1 满足目标约束 T1,因为在吸引和排斥中,物体都朝着力线合力的方向移动。S2 满足 T2,因为物体会经历横向排斥,就像力线之间的情况一样。


Maxwell确定,一个在轴周围具有对称静水压力的流体介质以及沿轴向的简单压力,提供了与这两个源约束一致的机械模型。赤道方向上的超额压力可以解释为介质中涡流的离心力的结果,这些涡流的轴与力线平行。也就是说,介质将具有旋转运动,旋转的方向由 T3 确定,以产生与电流周围的力线方向相同(物理学家现在称之为“手性”)的力线。


图2.6 我对Maxwell描述的涡流介质的呈现


尽管Maxwell并没有直接提及Thomson 1856年的论文,其中提出介质中的涡流运动可以解释通过磁场的偏振光平面的旋转,但Maxwell论文第一部分的标题“分子涡流理论应用于磁现象”隐含地提到了这一点。涡流流体模型满足迄今为止所有的目标约束,以及一个隐含的经验约束:

T5. 磁力是双极的。


也就是说,假设图2.7代表一个单一的涡流,如果从磁体的南极(小端)沿着一条力线向北极观察,涡流是顺时针旋转的。Maxwell在分析各种磁现象时只需要考虑这样一个单一的涡流。


图2.7 我对Maxwell描述的单一涡流的呈现


然而,无穷小涡流系统并不对应于任何已知的物理系统,因此也不提供现成的类比。涡流流体模型结合了两个领域的约束,因此在显著的方面同时代表了流体动力学和磁学。在使用该模型进行推理时,需要理解它满足适用于可能类型的实体和过程的约束,这些实体和过程可以被视为构成任一领域。通过该模型进行推理使Maxwell能够利用连续介质力学的数学表征结构,推导出对流体动力学解释的应力方程,然后再推导电磁解释的应力方程。他在整个过程中使用的步骤是:(1)构建模型;(2)推导连续介质力学解释的数学表征;(3)构建模型的量和关系与电磁量和关系之间的映射,以重写后者的方程;(4)评估电磁解释。


涡流模型捕捉到显著的隐含几何和定量约束,这些约束与Faraday的力线所具有的丰富约束相匹配,正如Maxwell在之前的运动学论文中分析的那样。他在此并没有将这些约束明确化,但一开始就表示他的目标是对这些力线给出动态解释。几何约束的例子包括与实验产生的磁力线的配置相关的约束,例如两个磁体之间的吸引极靠近时的力线,或连接单个磁体的极(见图2.1)。配置约束通过每个涡流的形状得到满足。读者在跟随我的描述时,应查看图2.7。涡流离其源点越远,宽度越大,这使得该系统具备了一个特性,即当力线接近其中点时,线间距离变得更远。


定量约束的例子包括与磁强度相关的约束,例如,在两个磁体之间的较外侧力线上的某一点磁强度较低,或者沿着力线从中点移动到端点时磁强度增加。沿着力线的强度变化对应于涡流从其源点移动时周向速度的降低。随着离轴线的远离,强度的变化对应于距离轴线较远的涡流宽度更大,因此在相应点的速度较低。与磁体强度和渗透率相关的变量分别对应于轴向的压力和介质中涡流的密度,强磁体对应于更大的压力,较低的密度对应于更大的渗透率。这些流体介质的定量特性满足涡流周围速度的约束,这些约束是连续介质力学作为构建模型的源领域所必需的。涡流运动提供了一种因果机制,原则上能够产生力线的配置以及它们之间和内部的应力。


图2.8 Maxwell的涡流和力线的横截面图。Maxwell,1890年a,第1卷,460页


Maxwell从该模型中最重要的推导是“应力张量”,它表示由于内部应力而作用于磁介质某一元素的合力。在讨论数学结果的解释时,他提供了北极和南极磁极的涡流和力线配置的可视化表示(见图2.8),并附有文本指导读者如何想象涡流在纸面上方和下方平面中的运动,以及如何将这些运动与涡流的机械效应联系起来。例如,在Maxwell的图1到图3中,我们应想象“纸面上方的涡流部分将向e [东] 移动,而该平面下方的部分将向w [西] 移动”(459页)。


图2.9 Maxwell的电缆周围力线的横截面图。Maxwell,1890年a,第1卷,463页


两个进一步的推导明确了Maxwell在分析中之前未讨论的重要目标约束。任何充分的模型都需要满足安培定律,它将电流和磁性联系起来,并且在极限情况下,需要符合作用于距离的反平方定律,即库仑(Coulomb)定律,正如法拉第为不同密度介质所概括的那样。利用为应力张量构建的电磁替代映射,Maxwell推导出一个数学表达式,将电流密度与电流载体周围磁场的环流联系起来,这满足了他在1855-1856年论文中推导的安培定律的微分形式(Maxwell,1890年a,第1卷,194页)。这一新的推导并不是基于连接电流和磁性的因果机制的模型表示;它和早期论文一样是描述性的。Maxwell在推导中附上了一幅插图(图2.9),展示了涡流的运动及其周围力线的配置,并提供了如何想象这些运动的描述。


这一推导确立了在介质中没有电流且具有统一磁导率的极限情况下,可以推导出库仑反平方定律。Maxwell还为更一般的情况推导出了该定律的微分形式,这些情况涉及电流和各种介质,例如空气和水。因此,该模型满足了隐含的目标约束,即在适当条件下与已建立的数学结果一致:

T6. 该模型符合安培定律(Ampère’s law)。

T7. 该模型在极限情况下符合库仑定律(Coulomb’s law)。


在之前的分析中,Maxwell 已经能够利用单个涡旋的数学性质,推导出一个关于磁感应、顺磁性和抗磁性的数学表示形式,这与已知的磁系统约束相一致。第一部分构建的涡旋流体模型成为了 Maxwell 其余分析的起点,所有后续推理都基于对该模型的修改。


到目前为止,我们已经讨论了源域和目标域如何对模型施加约束。在下一节中,我们将看到如何通过操控模型本身生成约束(M),这些约束在他后续模型的构建中起到了作用。


模型2:涡旋-空转轮(Vortex-Idle Wheel)

Maxwell在分析的第二部分开始时指出,其目的是探讨磁涡旋与电流之间的联系,这是满足初始约束I1所必需的。在分析的这一部分中,涡旋流体模型的调整源于模型本身产生的约束。分析电流与磁性之间的动力关系需要修改模型1,以提供连接它们的机制。模型本身引发了关于涡旋如何被带动的问题,解决这一问题应该能够得出电与磁之间关系的表示。迄今为止,Maxwell的计算忽略了相邻涡旋之间的相互作用,专注于单个涡旋的磁现象分析。从技术上讲,通过假设涡旋之间的力可以忽略不计,这是合理的。然而,电磁学的动力解释不能忽视这些力。Maxwell在分析开始时承认了模型存在的一个严重问题:“我发现很难想象在介质中,彼此相邻的涡旋以相同的方向旋转的存在” (1861-1862, 468)。图2.10是我根据Maxwell的描述和图表绘制的横截面图,清晰展示了这个问题。


图 2.10 我的涡旋模型横截面图


当想象涡旋在运动时,我们可以看到涡旋之间的直接接触会产生摩擦,从而导致堵塞。此外,由于所有的涡旋都朝同一方向旋转,因此在接触点它们的运动方向相反。如果它们以相同的速度旋转,整个机制最终将停止。因此,该模型提供了以下约束:

M1. 涡旋接触处会产生摩擦。


一个经过调整的模型必须通过创造一种分离涡旋的方式来适应这一约束,同时保持它们的运动。Maxwell 表示:“帮助我构想这种运动的唯一概念是涡旋被一层颗粒物分开,这些颗粒物充当空转轮,插在每个涡旋之间,使得每个涡旋都有使相邻涡旋按相同方向旋转的倾向”(ibid., 468)。他指出,在需要旋转部件平稳移动的机械设计中,这类问题通过引入“空转轮(idle wheels)”来解决。他提议以类似的方式调整模型。


然而,机器中遇到的普通空转轮是固定旋转的,因此只能代表绝缘体的情况。为了表示导体中电流的运动,空转轮颗粒需要能够进行平移运动。Maxwell 指出,在机器力学的源领域中存在这种空转轮,例如“在附加齿轮传动和其他装置中,例如西门子蒸汽机的调速器”(ibid., 469)。接着,他展示了如果将颗粒的平移运动视为电流的流动,预期的力线分布将会出现。他引入了一个类比和图示(图 2.11),与另一种机械齿轮配置相关,即“齿轮或驱动其轮子的齿条”(ibid., 472),这展示了“环绕电路的磁力线”(ibid.),直接与之前讨论的法拉第图(图 2.3)相关。


图 2.11 Maxwell 绘制的机制示意图,展示了涡旋 V和 V’ 之间颗粒的运动将产生磁力线 MM';Maxwell 1890a,第 1 卷,第 VIII 册,第 1 幅


在这一分析中,Maxwell 并没有利用任何现有机制;相反,他是在研究一种特定类型的机制。他的分析直接与对原始模型的设想修改相结合,以确定基于电磁现象和模型约束的特定修改特征——通用空转轮颗粒。例如,关于颗粒之间关系的具体理想化——即在原地旋转时没有滑动且它们不接触——是由额外的目标约束所决定的:

T8. 环绕恒定磁源的力线可以无限期存在。


这反过来在确定模型机制的性质时变得突出。在该模型中,T8 对应于对机制的约束:

M2. 当颗粒在原地旋转时,没有能量损失。


然而,在代表电流情况的平移运动中,颗粒会遇到阻力,从而导致能量损失并产生热量。也就是说,要使颗粒处于平移运动,涡旋的速度需要不同。当颗粒移动时,它们会遇到阻力,通过产生热量浪费能量,这与电流是一致的。因此,模型约束:

M3. 运动中的阻力造成能量损失,满足现在突出的额外目标约束。

T9. 电流会导致热量损失。


最后,与第一个模型的分析一样,这个模型也必须满足各种定量约束。例如,Maxwell 将角速度视为常数以简化计算,这产生了一个额外的模型约束:

M4. 涡旋的内层和外层之间没有滑动。


在第二部分的数学分析中,这个约束要求将涡旋视为刚性伪球体。如此设想,涡旋似乎与第一部分中隐含的几何约束不一致,表面上这些约束要求涡旋具有弹性。Maxwell 在这里没有解决这个问题,但这将成为他在第三部分对静电学分析中模型修改的关键。


最终得到的涡旋-空转轮模型是一个混合结构,结合了两个源领域:流体动力学和机械力学,满足这些领域、电磁学以及模型自身的约束。在本节中——与第二部分的其余部分一样——Maxwell 推导了模型中颗粒与涡旋之间关系的方程,然后构建了模型与目标电磁现象之间的映射。他指出新的结果与之前推导的结果的一致性。一个重要的结果是,颗粒的通量密度被证明代表了电流密度,从而满足 T6。


在讨论结果时,他提供了与合理机械机制的类比,作为他推导的空转轮颗粒与流体涡旋之间具体关系的例证,以确立存在真实的物理系统来体现模型的通用关系。图 2.12 特别有趣,因为它再次明确提到了法拉第的图 2.3 中的互锁环,再次使用“环绕”的说法,其中 C 是环绕感应环 B 的导线。Maxwell 使用这幅图来说明他所称之为的“实验”(ibid., 478),这是他在思考中进行的。


图 2.12 Maxwell 对电动势如何在模型上诱发电流的思想实验的表现;Maxwell 1890a,第 1 卷,第 VIII 册,第 3 幅


实验的目的是确定该模型是否能够捕捉到已知的电磁感应现象。本质上,通过空转轮颗粒的作用改变涡旋的速度应该能够诱发电流。


一旦他确立了涡旋-空转轮模型确实能够表示电流与磁性之间的关系,Maxwell随即考虑模型中能够引发已知电动力学现象的动态力。在进入该分析的大纲之前,重要的是要注意 Maxwell 如何用模型进行推理,以及他所做的推断应如何理解。他强调,空转轮机制不应被视为“存在于自然界中的一种连接模式”(ibid., 486)。相反,它是“一种机械上可想象且易于研究的连接模式,旨在揭示已知电磁现象之间的实际机械连接”(ibid.)。实际上,空转轮机制对于流体机械系统来说是一种高度不可信的连接方式。Maxwell 在这里指出的是,即便如此,模型中产生应力的力之间的关系结构确实对应于电流电学与磁性之间力的关系结构。Maxwell 的假设是,它们属于同一类机械系统,而不是它们是相同的机械现象。例如,“轮轴上的压力”(ibid.)在特定于当前问题目的的条件下,是属于能够产生与机械电动势相关的应力类型的机械系统的一种现象;但它并不是相同的现象。推动这一分析的是这样一个假设:空转轮与涡旋之间的动态关系与当前与磁性之间的关系在本问题的背景下是同种类型的,而不是它们各自的具体机制是相同的。


Maxwell 成功地使用该模型推导出描述电流与磁性之间动态关系的数学方程,这些方程是基于涡旋与空转轮之间的动态关系。许多目标、模型和定量约束在这一分析中起到了重要作用,这里只讨论其中的重点。从电与磁之间关系的实证研究中得出的最显著的额外目标约束是:

T10. 稳定的电流在其周围产生磁力线

T11. 启动或停止电流会在与其平行的导线中产生一个方向相反的电流

T12. 导体在磁力线之间的运动会在其内部诱发电流


我们可以通过参考 Maxwell 将模型设想为运动状态的表现,来看到该模型如何满足约束 T10 至 T12。


请注意,为了展示堆积,Maxwell 在十二面体的横截面视图中使用了六边形,这在极限情况下接近球体(图 2.13)。模型的图示表示伴随着文本,以正确地使其生动化:

让从左到右的电流在 AB 处开始。AB 上方的涡旋行 gh 将朝着与钟表相反的方向开始运动。我们假设涡旋行 kl 仍然静止,那么这两行之间的颗粒层将受到下方的行 gh 的作用,而上方则保持静止。如果它们可以自由移动,它们将以负方向旋转,同时从右向左移动,或与电流相反的方向,从而形成感应电流。(Maxwell 1890a,第 1 卷,第 477 页,原文强调)


他继续以这种方式给出指示,说明如何通过使图示生动化来观察其他感应现象,最后总结道:“因此,感应电流的现象似乎是将涡旋的旋转速度从场的一个部分传递到另一个部分的过程的一部分”(同上)。


作为一个例子,我们可以看到稳态电流与磁力线之间的因果关系是如何被捕捉的。需要连续的颗粒流动来维持电流周围磁力线的配置。当电动势(例如来自电池的电动势)作用于导体中的颗粒时,它会推动这些颗粒并使它们开始滚动。颗粒与涡旋之间的切向压力使邻近的涡旋在相对的两侧朝相反的方向运动,从而捕捉到磁性的极性(T5),这种运动在整个介质中传播。Maxwell 导出的数学表达式将电流与涡旋对颗粒施加的旋转力矩联系起来。颗粒的平移速度是其两侧涡旋速度差的一半,这满足了 T10。Maxwell 表明,该方程与他在第一部分中导出的关于稳态电流周围磁力线分布和配置的方程是一致的。


图2.13 Maxwell通过涡旋-空转轮机制表示的电磁感应。Maxwell 1890a,第1卷,第VIII版,图2


另一种推动Maxwell推理的方式是,该模型的力学对于电磁感应的两种主要情况有所不同,因此推导分为两个部分。考虑到目标约束(T11和T12),没有理由将电磁感应的两种情况不对称地看待;但在模型中,这两种情况有不同的原因。第一种情况涉及由变化的磁场产生的作用于静止导体的电动势。这种情况对应于约束T11,即感应发生的条件,例如,当在导电环中开启或关闭电流时,会在附近的导电环中产生相反方向的电流。该约束可以重新表述为T11':变化的(非均匀)磁场在导体中感应出电流。


在模型中,变化的磁场通过以下方式感应出电流(读者在阅读我的描述时应参考图2.13)。电流的减少或增加将导致相邻涡旋中的速度相应变化。导体所在的涡旋行的速度将与下一个相邻行的速度不同。这种差异将导致围绕这些涡旋的空转轮粒子加速或减速,这种运动又将传递给下一个涡旋行,以此类推,直到到达第二根导电线。在该导电线中的粒子将通过涡旋之间的差分电动势被设置为平移运动,从而诱发出一个方向与初始电流相反的电流。相邻的涡旋将以相同的方向开始运动,而介质中的阻力最终将导致平移运动停止,使得粒子仅在原地旋转,从而不再产生感应电流。图2.12专门说明了这一机制。


第二种情况满足约束T12,其中电流是通过导体在磁力线间的运动而感应产生的。当导电线在介质中移动时,会导致涡旋的变形,从而引起速度的变化。Maxwell在分析中考虑了流体介质的形状和位置的变化。简而言之(同样,读者在阅读我的描述时应参考图2.13),导电线运动方向上的介质部分会被导线压缩,导致涡旋伸长并加速。在导线后面,涡旋将收缩回原位并降低速度。净力将推动导体内部的空转轮粒子,从而在导线两端连接电路的情况下产生电流。


在他推导出每个感应机制的数学表示后,Maxwell提供了一系列详细的说明,指导如何可视化线、涡旋和导体之间的关系(1861-1862,483-485),并提供了两个图表,即图4和图5,见第八版图(图2.14)。


图2.14 Maxwell关于围绕静态导体(图4)和移动导体(图5)的力线的绘图。Maxwell 1890a,第1卷,第八版


例如,我们被告知要将导线视为与涡旋的轴垂直,并沿着一套从北到南的力线向东到西移动;因此,粒子将沿着与纸面垂直(即从纸面出来的方向)通过导线,在这种情况下,当涡旋使得相邻粒子垂直于纸面向上移动时,电动势为“正值”(同上,484,原文强调)。他对图形的描述告诉读者如何通过涡旋-闲轮模型理解电磁现象。


在他分析的这一部分结束时,Maxwell用数学表达了机械介质中重要的电磁现象,并显示出该模型满足来自已知目标现象的显著约束。然而,到目前为止的分析并没有完全满足最初的约束条件 I1 和 I2。为此,他仍需:(1) 确立在介质中连续作用对于电磁力的传播是至关重要的,也就是说,展示作用的传播存在必要的时间延迟并计算传播在介质中的速度;(2) 将静电纳入模型中。


表示静电需要对模型进行额外的调整,这为计算作用传播的时间延迟提供了手段。这篇论文的第三部分在前两部分发布八个月后才出版,表明Maxwell在首次发布前两部分时并没有看到如何进行修改。从某种意义上说,这令人惊讶。考虑到空闲轮粒子的通量密度与电流之间的对应关系,模型的自然扩展是将粒子的过量积累与电荷进行识别。然而,Maxwell从模型中推导出的方程仅适用于闭合电路,而闭合电路不允许电荷积累;因此,未解决的问题是如何表示开放电路。调整模型以解决表征问题导致了安培定律(Ampère's law)的修改 T6,并提供了一种计算模型中运动横向传播的手段,从而满足 I1 和 I2。


静电的分析让解读Maxwell的学者感到困惑。这主要是因为他的符号约定与现在的惯例(以及Maxwell后来所认为的惯例)并不相同。他在描述介质中横向效应传播的方程时也犯了符号错误。这些问题使许多评论者认为模型在Maxwell的分析中几乎没有作用,甚至有一位评论者指责Maxwell篡改了他的结果,并在推导方程后编造了这个模型(Duhem 1914年)。我认为,将Maxwell理解为使用模型3进行推理,并借鉴先前关于弹性的研究,可以解释所有所谓的错误,只有一个可以轻易解释为替代错误(Nersessian 1984a,b)。然而,我的论点得到进一步支持,考虑到为什么Maxwell会花费如此长时间才得出看似相对简单的模型修改——即涡旋具有弹性。丹尼尔·西格尔(Daniel Siegel 1991年)在对涡旋-空闲轮模型进行详细历史分析时,提出了一个令人信服的论点,认为Maxwell无法立即解决开放电流的情况,因为在模型2中,涡旋-空闲轮机制与介电物质之间的界面会发生不连续性。这种不连续性导致安培定律(如在 T6 中表述的)与考虑开放电路时显著出现的一个附加目标约束之间的不一致性:

T13. 充电是连续的。


西格尔的解释加强了我对模型在Maxwell思维中所起的积极作用的论证。这一延迟发生是因为Maxwell需要找到一种方法来调整模型2,以使这两个约束一致。


模型3:弹性涡旋-空转轮

图2.15 伪球体


然而,他现在承认,作为机械系统的所有版本模型的一个显著约束是:

M5. 旋转是从涡旋的外部传递到内部部分的。


为了满足这一约束,他赋予了涡旋单元材料弹性。注意,如果分子涡旋是球形的弹性材料块,它们在旋转时也会具有满足第2.3.1节中讨论的几何约束的正确形状。也就是说,它们在旋转时将是“顶部状”的弹性块(见图2.7和图2.15)。


明确认识到涡旋的弹性特性为在模型上表示静电荷提供了手段。Maxwell在分析开始时指出了这一约束:

T14. 与带电物体相关的“电张力”在实验上无论是由静电还是电流产生都是相同的。


物体中的张力差异将产生电流或静电,具体取决于它是导体还是绝缘体。Maxwell指出,在静电感应过程中,电可以被视为在介电分子内“位移”,使得一侧变为正电,另一侧变为负电,但并不从一个分子传递到另一个分子。然后,他表示,尽管这种位移不是电流,但位移的变化是“电流的开始”(1861-1862年,491页)。因此,结合图2.13的表示,并想象涡旋是弹性的(模型3),我们可以看到,在静电感应过程中,静电力在涡旋中产生了轻微的弹性变形,导致闲轮粒子产生轻微的平移运动,并在介质中传播。这种运动被称为“位移电流”。


重要的是要理解,如果没有模型,就没有基础来讨论“电流”。闲轮粒子的平移运动构成了电流。因此,“位移电流”的推导直接源于模型中的机械过程。回想一下,Maxwell在首次引入闲轮粒子时明确区分了导体和介电材料之间的差异。在导体中,粒子可以自由地从一个涡旋移动到另一个涡旋。而在介电材料中,它们只能在原地旋转。在静电感应(介电介质)过程中,粒子因涡旋的弹性变形而受到向前的推动,但由于它们在介电介质中受到限制,只能在原地旋转,粒子对涡旋施加反作用力,以恢复其原位。这一机制在方程中得到表示,该方程将电动势与位移联系起来,而位移的方向与现在以及Maxwell后来的工作中习惯的方向相反。因此,符号的差异可以通过认识到模型中的弹性恢复力与施加的力方向相反来解释,因此这两个量应该具有相反的符号。如果没有模型,就没有清晰的方法来解释符号差异。


在这个过程中,粒子的运动类似于“电流的开始”(实际上是反向电流),因为它们的前向运动导致了介质中位移的短暂传播。然而,这种运动“并不等同于电流,因为当它达到某个值时会保持不变”(同上,491)。也就是说,系统达到了某种应力水平并保持在那个水平。因此,电荷可以表示为由位移的闲轮粒子积累所产生的介电介质中的过剩张力。这与法拉第和Maxwell关于场产生电荷(和电流)的概念是一致的,这与当代对场的理解(场源自电荷和电流)有所不同。总之,没有模型,“位移电流”就没有物理意义,这正是许多《论电磁场》的读者所困扰的地方(Maxwell 1891),在这部著作中不再使用机械模型。它与模型3的联系也为Maxwell1864年的分析带来了困难(Nersessian 2002a)。


在一些进一步的推导之后,Maxwell提出了修改安培定律方程的必要性,以包括“介质中的弹性效应”(1861-1862,496)。也就是说,由于涡旋是弹性的,并且在导体中粒子是自由移动的,因此介质中产生的电流(模型中单位面积内的粒子净流动)必须包含由于弹性造成的粒子运动因素。Maxwell修正后的电流方程形式再次展示了他的场观念及其与模型的关系:总电流等于旋转产生的磁强度减去由弹性变形产生的电动势。鉴于电动势的方向与涡旋的方向相反,位移电流实际上打开了闭合电路,这再次与现在的习惯解释相反。Maxwell的表达形式显然源自模型3。跟随图2.13,如果将涡旋视为弹性的,粒子的总通量密度源于涡旋的旋转以及涡旋弹性变形对粒子的位移效应。涡旋的旋转在同一方向上造成导体中粒子的平移运动。粒子的运动导致涡旋的弹性变形。涡旋的弹性变形又对粒子产生反作用力,即在相反方向上的恢复力。因此,电流由粒子的平移运动减去恢复力的影响表示。修改后的电流方程与T13一致,并且可以与已知的电荷连续性方程结合,推导出一个将电荷与电场联系起来的表达式,即库仑定律的微分形式。


Maxwell现在能够计算模型中的传播速度。这是因为增加了模型约束:

M6. 所有位移都是切向的,他只需要找到介质的横向传播速度。他将速度推导为电动力学单位与静电单位的比值,并使用韦伯和科尔劳斯实验确定的常数来获得它们之间的关系。这个常数的单位是毫米每秒,表示速度。Maxwell注意到,将这个数字转换为英制单位时,几乎与光速相同。Maxwell在这里所说的重要性在于:“我们几乎无法避免得出这样的推论:光是同一介质的横向波动,而该介质是电和磁现象的原因”(同上,第500页,原文强调)。也就是说,这些速度之间的密切一致性并非巧合。然而,尽管诱人,他却“避免了这一推论”。请注意,他并不是在避免得出光是一种电磁现象的推论(他从一开始就明显对此有所怀疑);他是在避免对光以太和电磁以太这两种传播介质可能身份的推论。Maxwell的谨慎强化了我的解释:电磁介质中的横向速度的值直接由模型3的特定假设决定,并且没有独立的物理依据来假设光以太中的涡旋运动。在当时的主流观点中,光是在弹性介质中的横波,无法通过模型所提供的传播电磁作用的机制进行传播。


Maxwell通过展示如何使用他对静电力的分析来计算莱顿瓶的电容量,结束了第三部分的分析。第四部分将整个理论应用于磁场对偏振光平面旋转的影响,并展示了旋转方向取决于分子涡旋的角动量,这将整个分析与第一部分的约束联系起来。通过这个计算,他确定了所有显著的约束都得到了满足。尽管在阐述新表征和寻找电磁力传播的实验验证方面仍需进行大量工作,但此时Maxwell已经为物理学的概念和分析资源增加了一种新的解释工具——力的场表征。


讨论:Maxwell基于模型的推理实践


Maxwell的建模与对称性论证

由于Maxwell的案例在科学史和科学哲学中引发了大量评论,我首先简要讨论一下我的分析与这些文献的关系。在1970年代中期,我第一次阅读Maxwell在电磁学方面的研究时,发现许多评论者对他在1861-1862年论文中提出的模型的生成作用未予重视,这让我感到惊讶。Maxwell本人关于“物理类比”作为发现方法的评论——无论是在信件、出版物还是讲座中——大多被轻视,最多被视为“仅仅是暗示性”的(Heimann 1970),作为启发式指导的“价值有限”(Chalmers 1973, 137),而在最坏的情况下,则被认为是事后不诚实的虚构(Duhem 1914, 98)。在最后一种情况下,Duhem声称Maxwell在事后捏造了物理类比,甚至篡改了一个方程(见Duhem 1902),而“他获得的结果是通过其他途径得知的”(1914, 98)。


“通过其他途径得知”的说法是哲学家们经常提出的。当被问及“其他途径”是什么时,通常的回答是这些方程是通过对实验的归纳推导而来的,或者是通过与在Maxwell开始研究时根本不存在的方程相关的一致性论证得出的。无疑,实验结果在Maxwell的分析中起到了关键作用,但推导方程的过程并不是哲学家们通常所称的“归纳”。对一致性的追求——或称“对称论述”——解释了图2.16中所表示的方程的推导。


图2.16 “对称论述”


Mark Steiner在其最近的论述中指出:“一旦法拉第、库仑和安培的现象学定律被给出微分形式,Maxwell注意到它们与电荷守恒相矛盾。然而,通过对安培定律进行调整,添加‘位移电流’,Maxwell成功地使这些定律实际上暗示了电荷守恒。”(Steiner,1989,458页)。这种“调整”通常被解读为Maxwell注意到磁场方程没有包含电场的贡献。这一论述在物理学家中也经常被提到(例如,Jackson,1962,177页)。但是,对称论述中缺少的核心问题是,Maxwell首先如何将现象学定律给出微分形式,这导致了对他建模实践的研究,并最终对“调整”过程有了截然不同的解释。


哲学家们常常做出的另一个普遍看法是,既然事实上可以从Maxwell定律中消除以太——正如爱因斯坦的表述那样——那么它在理论发展中的作用就显得微不足道。这样的观点消除了或削弱了Maxwell所构建的以太模型的生成性作用。例如,Philip Kitcher声称,以太并不是一个“有效的假设”,而是一个“预设假设”,他认为错误地认为其存在是使理论主张成立所必需的(Kitcher 1993, 174)。既然不需要这个假设,它就可以简单地从Maxwell的理论中移除。然而,相反的是,如果没有以太作为连续介质的有效假设,Maxwell根本无法推导出这些方程。消除Maxwell理论中的以太,花费了数位杰出科学家四十年的研究时间,其中大多数人假设了以太的存在。


我已经展示了多种追溯Maxwell推理到模型的方法。例如,在对磁现象的初步分析中,Maxwell关注的是单个旋转涡旋。但分析的下一阶段需要充满旋转涡旋的介质,这产生了直接导致引入具有特定特征的“闲轮粒子”作为表征电磁感应因果结构的模型约束。此外,尽管在Maxwell分析的这一部分存在显著的符号“错误”,但除了一个较小的替换错误外,其他的都可以看作不是错误,尤其是当我们将他视为通过构建的模型进行推理时。此外,只有通过模型,他才理解如何表征电磁系统的能量,而这对于使用广义动力学重新推导数学表征是必要的,正如他在下一篇论文(1864年)中所做的那样。


在1861-1862年的论文中,Maxwell曾表示,他模型的因果机制能够提供现象的“机械解释”,当这些现象以某种抽象层次被理解时。在《Treatise》中,Maxwell提到,“确定建立某种连接所需的机制的问题……承认存在无限数量的机制”(1891年,第470页)。尽管他最初可能意图理解以太中产生电磁力的特定机制,但他能够构建的因果机制仅提供了以结构关系形式存在的高度抽象的解释;这些机制仅指定了可以产生正在研究的应力的机械过程的种类。它们并未提供选择哪些过程实际产生这些应力的方法。在后来的广义动力学讨论中,Maxwell将这种情况比作钟楼中的钟声敲击者只能看到绳索,而无法看到敲响钟声的机制(1890b,第783-784页)。然而,关于以太中潜在机械力的本质仍然是Maxwell在他不幸去世之前未能完成的项目,并且在此后的许多年里也仍然是物理学界未解的课题。


我们现在可以理解Thomson和Maxwell的类比方法之间的区别。Thomson的方法是采用已知物理系统的现有数学表述,如傅里叶对热的分析,作为类比源,构建源系统与正在研究的目标系统之间参数的映射,并将目标系统的参数替换到源方程中,在此情况下为静电参数。也就是说,Thomson直接利用两种真实世界领域之间的形式类比来进行数学结构推导。这是哲学和认知文献中通常讨论的类比推理过程。而Maxwell1861-1862年建模过程的不同之处在于,要映射到电磁学领域的类比源并不现成,而是必须构建出来。连续介质力学没有一个可以直接应用于问题的已解决问题的数学表述。相反,他构建了一系列介于源领域和目标领域之间的模型,体现了来自每个领域的约束,并通过这些模型进行推理。推导出的数学表达式捕捉了模型的结构关系,这些结构关系代表了目标领域和源领域之间的共同结构关系。Maxwell在机械解释的基础上推导了模型的数学结构,并替换了电磁参数,这一过程类似于Thomson的方法,但前面的推理过程却截然不同。对于Thomson来说,映射是从一个已解决的真实世界系统到另一个真实世界系统。Maxwell的数学表述是从模型中推导而来的,而不管这些模型是否能够在自然中以其完整形式存在;重要的是它们包含在机械上合理的因果结构——可行的机制,而不是产生电磁现象的具体机制。


我的解释提供了一个有力的论据,表明Maxwell的问题解决过程是通过建模过程进行推理的,这涉及构建多个机械模型,以代表机械以太中电磁力的产生和传输的因果结构——而非实际原因。这些模型整合了从(并与)连续介质系统、特定机器机制和电磁系统中抽象出来的物理和数学约束。这些约束被整合到一系列混合模型中,这些模型位于不同领域之间。在它们的数学处理过程中,这些共同的动力学属性和关系通过使其具体化的特定系统被分离出来,从而得出同时代表机械和电磁系统的方程。


在建模过程中,Maxwell不断评估模型及其从中得出的推论。子问题的解决方案随后被整合成一个连贯的数学表示。直到很久以后才得以确定,这个数学表示表达了一个非牛顿动力系统的动力学关系。也就是说,Maxwell为电磁现象推导出的数学结构将无法映射回用于其创建的机械源领域。这是一个高度创造性的模型推理范例,因为它为物理学引入了一个全新的概念。建模过程使Maxwell能够利用牛顿系统作为源,推导出一个非牛顿系统的法则。解释这一点将需要本书的其余部分。作为开始,我们需要理解一个我称之为“通过通用建模进行抽象”的抽象过程,我将在下面介绍与Maxwell的范例相关的内容,并在第六章中更一般性地讨论。


通过通用建模进行抽象

为了将分析扩展到Maxwell后续的工作,1864年的分析仅假设电磁介质是一个通用的“连接系统”,具有弹性,从而具有能量(见Nersessian 1984)。电磁介质与光以太被视为相同,并且以太被视为“一个复杂的机制,能够进行多种多样的运动,但同时又如此连接,以至于一个部分的运动根据明确的关系依赖于其他部分的运动,这些运动通过来自连接部分相对位移的力传递,因为它们的弹性”(Maxwell 1864,533)。连接系统的弹性提供了传输中的时间延迟。所需的只是对弹性系统的通用概念,认为其能够接收和储存能量。这样的系统能量有两种形式:“运动能量”或动能,以及“拉伸能量”或势能。Maxwell将动能与磁极化相联系,将势能与电极化相联系。一旦他抽象出适当的一组一般动力学关系,就可以将这些关系应用回源领域,而无需任何特定模型。


建模过程使他能够利用一般动力学的数学强大表示资源,尤其是偏微分方程,从而消除了对电磁现象背后实际以太力分析的需要。简而言之(参见 Buchwald 1985 以获得更深入的讨论),在牛顿力学形式中描述一个物体或物体系统的运动,需要计算每个物体在每一时刻施加给其他物体的力的总和(积分)。牛顿必须发明一种数学方法来进行这种分析,即微分计算。在十八世纪末,拉格朗日发展了一种分析方法(偏微分方程),使得可以绕过这一无穷小求和过程,只用有限数量来分析运动。他的分析形式之一,被称为势场分析,使得能够计算对一个潜在物体系统施加的力。例如,可以计算如果在一个已有的双体系统之间放置一个或多个物体将产生的力。这是一个数学结果,依赖于知道系统的势能和动能(我们现在称之为)。势场实际上并不存在——只有在物体被放置在其他物体之间时,力才会产生。最重要的是,在力的传输中没有时间延迟。有了时间延迟,就必须解决在物体和电荷周围空间发生了什么的问题。


该数学技术的假设是系统中的基本力是牛顿的远程作用力——事实上,它适用于机械系统:可以以一般动力学形式重新推导牛顿定律。这种分析方法对那些研究连续介质力学的人来说是一个福音,例如流体、弹性物质以及被认为是物质的热量,因为以积分的方式进行分析将需要对数百万个力进行求和。相反,可以简单地使用宏观表现来确定这两个能量量,并为系统写出运动方程。其中一些工作是通过类比映射完成的,例如,先解决流体的问题,然后直接映射到热量。此外,连续介质力学需要一种超越引力所需的有向力和场(向量)的表示,而Maxwell对电磁学的分析也促进了向量分析的发展。例如,“旋度”是力的循环;“散度”是它们的扩散。


Maxwell在十九世纪中叶的剑桥处于这一活动的中心。但没有人解决表示假设中的时间延迟(对于具有自身能量和动量的真实场所需)在电磁力传播中的问题。之前的分析仅提供了潜在场(虚构场)分析。为了解决表示问题,Maxwell实际上必须确定在电磁以太中(假设为一个微观上牛顿机械系统)与这两种能量相关联的宏观量,他通过我所分析的建模过程完成了这一点。没有现成的直接类比可以应用。建模过程导致了一组关于系统运动的偏微分方程,使他能够计算传输速度或时间延迟。一旦他知道如何表示动能和势能,他只需假设以太为一个连通系统,然后使用拉格朗日技术重新推导运动方程。在《Treatise》中,他的最终推导采用了他同事威廉·汉密尔顿开发的新型向量分析形式。一些表示电磁现象所需的数学已经存在,还有一些与电磁学的研究共同开发。但在整个过程中,Maxwell假设这些分析方法应用于由微观牛顿力产生的宏观现象。


在他的推理过程中,Maxwell从模型中所代表的具体机制抽象到该类机制的数学形式,换句话说,就是抽象到通用的动力学结构。这一过程是Maxwell与Thomson之间分歧的核心,Thomson从未接受Maxwell的数学表述,因为它并不源自于现实世界的解决方案。Maxwell自己的观点是,他的场方程并不比牛顿的万有引力法则差,因为牛顿的法则也是在没有具体基础因果机制知识的情况下提出的。在Maxwell的时代,广义动力学和牛顿力学被认为是共延的。今天我们所知道的,而Maxwell并不知道的是,许多不同类型的动力学系统可以在广义动力学的数学中得到表述,包括相对论和量子力学。电动力学系统与牛顿系统并不是同一种动力学系统。他通过通用建模过程所抽象的,是电磁学的一般动力学特性和关系的表示。这些抽象法则在应用于电磁学时,产生的是一种非机械性的动力学系统法则——也就是说,这些法则并不能映射回其构建所使用的机械领域。Maxwell的方程产生了根本上新型的模型。


未能遵循爱因斯坦的著名格言,许多人在哲学、历史和科学文献中如上所述,轻视了Maxwell的贡献;因为在否定1861-1862年的建模实践时,我们在Maxwell的论文、草稿和信件中找不到他可能使用的“其他方法”的证据。然而,通过研究他的“作为”,我们发现Maxwell的工作在言行之间存在着显著的和谐。与爱因斯坦和牛顿一样,Maxwell是我们可以通过关注他的言辞和行动来了解科学实践本质的科学家。我认为Maxwell通过一个逐步的建模过程构建了电磁场概念的数学表述,该过程涉及创建和推理一系列相互关联的模型,以满足经验、理论和数学的约束。在本章结尾,我转向考虑与内容稍微脱离的基于模型的推理,以寻找使其在概念创新中富有成效的线索。下一部分还旨在总结Maxwell的例证,以便于那些选择跳过大部分细节的读者。


基于模型的推理在概念创新中的应用

Maxwell创建的三个模型是对目标现象的解释,它们是为满足来自电磁学目标领域、连续介质力学和机械力学源领域以及模型自身的约束条件而构建的。这些混合模型处于目标领域和源领域之间,提供了一个进行推理和推导推论的背景,这些推论包括数学等式和物理假设。每一次模型迭代都是合理的,并且在上下文中具有充分的动机。每个模型都为目标领域的约束提供了洞见和详细阐述,给出了某些目标现象的数学表征,并带来了进一步的问题,而这些问题的表征解决方案是通过模型自身的功能提供的。最终的结果是对电磁学领域的一个根本性再概念化。


在分析过程中,Maxwell 讨论了他构建的模型中属性和关系的性质,绘制了模型特征的示意图,表达了模拟的设想,并提供了其他人如何在推理中可视化并想象这些视觉表现动态化的指导。虽然他并没有直接说明自己在思考中是否可视化或模拟了介质和机制的运动,但很难“避免推断”他确实这么做了。显然,他在这篇论文及许多其他场合中关于物理类比和各种数学表征形式的论述,指向了这种解释。Maxwell 的著作中充满了关于物理和数学推理中的“心理操作”的讨论。他对这一反思的一个特别精彩的表达,出现在他在《自然》杂志上关于新的数学形式,即他在《Treatise》中使用的Hamilton的四元数方法的一篇文章中:“这并不能……让人期待数学家可以通过将所有工作转移到他们的笔上来让大脑度假。它每一步都要求我们形成符号所代表的几何特征的心理图像,因此用这种方式研究几何学时,我们的大脑都在处理几何概念,而不会误以为自己是几何学家,而实际上只是算术家”(Maxwell 1873, 137)。我主张,证据表明 Maxwell 在从模型中进行推论时,“大脑确实在处理几何概念”。


根据我的解读,Maxwell建模过程中的推理一般类别包括(无顺序):抽象性、模拟性、适应性和评估性。图2.17提供了他的推理过程的示意图,旨在突出目标领域、源领域和构建模型之间的相互作用。


图 2.17 Maxwell 的建模过程


抽象推理包括极限情况外推、理想化、概括,以及我称之为“通过通用建模的抽象”,这将在下文讨论。模拟推理包括通过对模型进行动画处理来进行推论,例如想象涡旋运动对空转轮的影响,反之亦然。在模型1中(见图2.10)设想并排运动的涡旋,使Maxwell意识到相邻涡旋之间的摩擦会阻止它们的运动。他关于摩擦这一概念的推论使他通过引入空转轮粒子来调整模型。他所做的调整是对模型存在的问题以及他对目标问题的理解变化(在图2.17中通过target+和target++表示)的回应。后者包括对早期模型提供的新约束进行推论,例如,当他推断模型2中空转轮粒子运动时涡旋会发生什么,或模型3中它们在原地发生轻微平移时的情况。他对模型的评估通常基于模型选定特征在目标现象的显著维度上是否属于同类,例如在模型2中电和磁之间因果关系结构的考虑。这些评估导致了模型的调整,正如上文提到的情况,Maxwell认识到模型1与电动力系统不是同类,因为模型无法在涡旋之间存在摩擦的情况下保持运动。他的评估考虑包括对约束条件的拟合度、经验意义、数学意义以及解释力。在构建模型时,Maxwell 使用了领域知识、抽象原理知识以及如何进行适当抽象的知识。这些知识以不同的信息格式呈现,包括语言、数学和视觉形式。


模型的一个关键特征是,要将它们作为代表电磁现象进行推理,必须将其解释为在介质中产生应力的机制上缺乏具体性。源领域的功能是提供构建模型的约束条件和生成性原理,进而成为推理的对象。模型提供了具体的机制,但这些机制需要在足够的抽象层次上进行理解,以便识别约束条件如何适用于并转移到电磁领域。也就是说,模型是具体的,但在推理的背景下,它们被视为代表通用过程。例如,考虑对模型2中电磁感应的分析。在使用该模型进行推理时,应理解涡旋与空转轮粒子之间的因果关系结构得以保持,而不是涡旋和粒子的具体因果机制。事实上,作为流体动力系统的具体机制在自然界中是高度不可能的。然而,具体机制不需要现实,因为它所代表的是因果结构,而不是具体的原因。在解决各种表征问题时,Maxwell 将因果结构视为与使其具体化的物理系统分离。涡旋-空转轮机制不应被视为电磁感应的原因。它仅代表介质中未指明的潜在过程的因果结构,推论指向的也是这一结构。任何能够代表这种因果结构的机制都可以满足要求。具体机制被通用地处理,类似于在某些目的和条件下,弹簧或钟摆可以被通用地视为代表简谐振荡器类。


通用模型与所使用的具体表征之间的关系类似于类型与实例之间的关系。在表征中通过推理者将表征的各个组成部分解释为指代对象、属性、关系或行为的类型,而非这些的实例,从而实现通用性。通过具体过程来表征通用机制,为Maxwell提供了一个可以进行推理的具象对象,但推理的背景要求源领域中的具体物理假设不应被引入目标问题的分析中。考虑引入空转轮的实例。正如我们所见,模型2是从两个源领域——流体动力学和机械力学——构建的混合模型。要识别潜在机制,并将来自两个不同领域的显著实体和过程结合起来,需要在足够通用的层次上加以考虑。


类似的抽象推理使得Maxwell能够识别电磁系统的能量成分,并在1864年的分析中直接转向一般动力学公式,而无需考虑1861-1862模型的具体细节。图2.18展示了我对Maxwell推理的解读。


图2.18 通过通用建模识别能量成分


在1864年的分析中,Maxwell将以太视为一种通用的弹性介质,其约束条件可以通过许多具体的机械实例来满足。弹性系统可以以两种形式接收和存储能量:动能(运动)和势能(拉伸)。在模型1到模型3的示意图中,动能与涡旋的旋转相关联,这可以抽象为“旋转运动”的通用概念,然后在一般动力学分析中与介质中与磁效应相关的运动相对应。在模型3中,势能与涡旋和空转轮粒子之间的弹性拉伸相关联,这可以抽象为“弹性应力”的通用概念,在一般动力学分析中与由于静电效应产生的弹性拉伸相对应。有趣的是,并且为我的解释增添了可信度,早期具体机械模型的遗迹可以在他1864年的思维中发现;这在电流和电荷方程中产生了一个问题,这里讨论起来会超出我们的范围(参见Nersessian 2001, 2002c)。


根据我对Maxwell推理的解读,我们对之前提出的概念变化中的创造性难题有了一个合理的答案。在这个案例中,难题是:如果Maxwell确实通过所描述的建模过程推导出了电磁场的数学表征,那么他是如何通过类比牛顿力学领域构建一个非牛顿动力学系统的定律的?答案在于Maxwell并没有在这些领域之间进行直接的类比。相反,他构建了中介的混合模型,这些模型体现了来自牛顿源和电磁目标领域的约束条件。抽象过程,特别是通用建模,使得能够整合来自不同领域的选择性约束,因为这些约束在消除了领域特定差异的通用层面上进行考虑。因此,一种全新的表征结构应运而生——一种从分析中抽象出“机制”概念的表示,创建了一个非机械的动力系统的表征。以这种方式推导出的数学表征并不提供关于基础系统具体实现的信息。Maxwell自己假设基础结构包含了以太中的机械相互作用,并且他所制定的定律作为任何可接受机制的约束。在这一点上,他认为自己遵循了牛顿在制定万有引力定律时所采用的相同策略:“在试图解释这种力量是如何传递之前,首先要调查物体相互作用的力量”(Maxwell 1890b,原文强调)。实际上,我们可以为牛顿如何在推导此定律时使用基于模型的推理和通用建模的抽象构建类似的故事。正如我们所知,尝试在牛顿和Maxwell的案例中具体化“如何”的历史导致了物理学中的进一步重大概念变化。


我对Maxwell通过模型构建、操控和适应进行推理的解读假设了进行这种推理所需的某些认知能力,即模拟、类比和形象化的思维方式。在讨论基于模型的推理的认知基础之前,我将首先展开一个平行的示例,展示在协议研究中解决更平常问题的做法。




版权声明:此编译稿仅供大家学习,不得用于商业用途。版权归原作者。如涉及侵权,请告知,将及时处理。



教育牧笛
本公众号主要发布:1.第一线教师开展有效教学实践研究的成果;2.课堂有效教学实录;3.有关有效教学研究的学术观点争鸣;4.有效教学的国际比较研究动态;5.有效教学的学科研究方法。
 最新文章