10组带领人们走向现代的物理公式(四)

8、粒子位置、动量与波函数的关系

粒子位置的均值:
AVG(rₑ) = ∫ψ*( r) r ψ(r) d³ r

粒子动量的均值:
AVG(pₑ) = ∫ψ*( r) (– iħ∇) ψ(r) d³ r

粒子位置、动量的标准差:
Δ(r) * Δ(p) ħ/2   (海森堡不确定性原则)

———————-

在上一篇最后,我们写出了一个符合德布罗意关系的具体波函数:

ψ(x, t) = A e^[i (p·x – E*t) / ħ]
式中 ħ = h / 2π

不过这个波函数代表的是一个在无限空间中均匀分布的平面波,它还没有达成我们构造波函数的一个初衷 —— 波的“强度”要有个不那么平凡的空间分布,毕竟我们是关心粒子的位置与运动的。

显然,我们应该能够找到些更一般的波函数,让它们的模并非在整个空间中保持为常量。例如下图,我们画出了一个球对称的波函数,它的模在原点处最大,并随径向距离增加按指数衰减;辐角在整个空间保持同相位变化、频率恒定。作图模式与上篇中“德布罗意波”的动图一致,都是用转盘表示波函数在该位置的复数值:转盘直径代表复数的模,转角代表复数的辐角,红蓝代表复数实部的正负性。这样,转盘面积也反映了波函数的模平方。

图1:一个球对称的波函数(氢原子1s轨道)
ψ₁₀₀(r, t) = A₁₀₀ e^(–|r|/a) e^(–iE₁t/ħ)

事实上,在数学上可以证明,只要把不同动量的平面波进行适当加权叠加,我们就可以得到具有各种空间分布的波函数。问题是,这样的一般的波函数怎么跟粒子位置建立对应关系。特别是,在经典观念中,粒子是一个质点,而波必然有空间范围,一个点如何跟一片空间区域对应。这就容易产生一种误解,以为物质波和粒子是分开的两件事物,“物质波引导着点粒子运动”。但如果你觉得这么想象更直观,那也无妨带着这种半经典观念再多些时间,毕竟早期的物理学家也不是一下子就对波函数的诠释达成一致认识的。这不影响继续推导物质波模型的数学性质,因此没有必要因为很难凭生活经验想象“波就是粒子、粒子就是波”,而放弃了后续思考

回顾构造波函数的过程,我们当初想让波函数的模也是一个空间位置的函数,在粒子频繁出没的区域,波函数的模大一些,在粒子不会抵达的位置,波函数的模小一些,甚至为 0。因此,如果知道波函数的解析式,要反过来找粒子的位置,最自然的想法是,应以波的“强度”为权重,对各处的空间坐标进行加权平均,正如已知物体的密度分布求质心位置一样。

图2:高一能级的球对称型波函数(2s轨道)
ψ₂₀₀(r, t) = A₂₀₀ (1-|r|/2a) e^(-|r|/2a) e^(–iE₂t/ħ)

我们不妨用 |ψ(r)|² 来作为物质波在位置 r 处的“强度”权重。这里用了不显含时间 t 的波函数 ψ(r),可以认为 ψ(r) 是在某一个时间切片上,波函数单纯的空间分布。为什么要用模平方,而不是模本身,这和说电磁波在一个地方的辐射强度,要用平均能流密度(振幅的二次项),而不是电、磁场强的振幅本身(一次项)类似。以 |ψ(r)|² 作为权重,对位置矢量加权积分,有:

AVG(rₑ) = ∫|ψ(r)|² r r / ∫|ψ(r)|² d³ r    式(1)

如果我们的波函数满足归一化条件,即:∫|ψ(r)|² d³ r = 1

那么式(1)化为:

AVG(rₑ) = ∫|ψ(r)|² r r

由于复数的模平方 |ψ(r)|² 可以写成复数和它的复共轭之积 ψ*( r) ψ(r),故式(1)也一般写为:

AVG(rₑ) = ∫ψ*( r) r ψ(r) d³ r

这就得出了粒子位置 rₑ 与波函数 ψ(r) 的关系。

注意等号左侧,我们并没有直接写 rₑ,而是用了 rₑ 的均值。这源自量子力学的“哥本哈根诠释” —— 经过数十年天王级的争辩,多数物理学家开始承认微观粒子的位置是一个随机变量,因此等号左边要写为粒子位矢随机变量的均值 AVG(rₑ),而不是代表确定性的坐标本身。

事实上,观察我们动图中的波函数就可以知道,粒子位置均值提供的信息,远没有波函数的信息丰富;而且,有可能在均值位置上,物质波的“强度”恰恰是零(如下图)。因此,如果直接认为粒子的“实际”位置就严格在均值点上,显然是不对的,那样波函数包含的更多信息也将被丢弃。这些波函数的信息意味着什么,提示人们必须重新思考微观粒子位置的含义。

图3:纺锤形波函数(2p_z轨道,可以注意到,原点两侧对应位置的波函数值总是正负相反,这种情况称为波函数具有奇宇称)
ψ₂₁₀(r, t) = A₂₁₀(|r|/2a) e^(-|r|/2a) cosθ e^(–iE₂t/ħ)

将随机性引入量子力学,又是一次颠覆性的观念变革。在最初的几年里,人们认为随机性来自测量仪器的不完美,或是已知信息的不充分。而后来哥本哈根学派更彻底地认为,随机性是物质固有的特性,只要没去测量,物质就一直保持着随机性。

为何量子物理发展到这时要引入随机性,通过式(1)也能解释,因为它和用随机变量 X 的概率密度函数 f(x) 求它均值 AVG(X) 的公式在形式上一致:

AVG(X) = ∫f(x) x dx

因此,单纯从形式上讲,是可以将波函数的模平方 |ψ(r)|² 类比于一个随机变量(粒子的位置矢量)的概率密度函数。一旦接受这种类比,相当于给波函数的模平方 |ψ(r)|² 赋予了物理意义,即粒子出现在 r 位置的几率密度。这正是哥本哈根诠释的核心。

除了哥本哈根诠释之外,也有人试图将 |ψ(r)|² 解释为粒子质量(能量)的分布密度,将式(1)类比于宏观物体质心的计算,同样是很直接的想法。但这种解释会导致微观粒子的“形状”随时间演变、分裂,甚至出现超光速现象。特别是那些一次只释放一个电子的实验证明,尽管 |ψ(r)|² 可以分布在很大的空间区域中(这一点可由实验产生的波动特征图像佐证),但每次观测都只能在一个位置找到完整的电子,如果 |ψ(r)|² 是质量(能量)的分布密度,那将说明已经在空间中分散了的质量(能量),在观测的一瞬间又聚集到了一点,且质心也瞬间偏离均值位置,成为超距现象。

正是各种其他解释的失败,最终让哥本哈根诠释为人们普遍接受。

———————-

刚才我们通过上述分析,知道了已知 ψ(r) 求粒子位置均值的方法。但如果只看到这一点,我们可能认为 ψ(r) 的物理意义就在于提供关于粒子位置的信息。

实际上,波函数 ψ(r) 提供的信息不止于此,玄妙在于通过“观察”它的辐角部分在空间上的周期性分布,我们还可以间接了解到它的波长、以及波的传播方向(两个要素结合即波矢),也就是粒子的动量信息。

拿到一个周期性函数 ψ(r),求它的波长,这在数学上有现成的高级工具 —— 傅立叶变换。傅立叶变换就是为了将时域信号(在我们的情景下为坐标域信号)和频域信号(我们情景的动量域信号)相互转换而生的。还用上一篇厨房的比喻来说,它就像价值几万块钱的全自动蒸烤一体机,买了放在你们家好长时间,这回可算派上用场了。

说句题外话,如果你爱看网络视频的话,那么傅立叶变换时时在为你服务。很多影像、音频的信号在时域上很占比特位,但在频域上就集中得多,通过傅立叶变换算法,人们可以把信号占用的比特率压缩,而只损失较少的品质。

言归正传,我们在量子物理中,把之前根据自然想法构造的、以坐标 r 为定义域的波函数 ψ(r),称为波函数的坐标表象;把经过傅立叶变换,定义在动量域上的波函数 ϕ(p),称为波函数的动量表象。二者关系为:

ϕ(p) = (2πħ)^(-3/2) * (∫e^(– i*p·r/ħ) Ψ(r) d³r)

Ψ(r) = (2πħ)^(-3/2) * (∫e^(i*p·r/ħ) ϕ(p) d³p)

我们刚还在争论中摸索着 Ψ(r) 的意义,现在又冒出来一个更不好直观理解的 ϕ(p)。我们只好按与先前一致的解释,将 |ϕ(p)|² 理解为粒子的动量 pₑ 取值为 p 的概率密度。

这也就是说,对于粒子的物质波“强度”在空间上不均布的一般状态,不止粒子的位置是随机变量,它的动量也要被视为随机变量。上篇德布罗意波里那个确定的参数 p 不见了,只能通过波函数反求它的均值、方差。同样,粒子动量的均值可表示为:

AVG(pₑ) = ∫ϕ*( pp ϕ(p) d³ p

证明从略,如果拿到的是坐标表象的波函数 Ψ(r),粒子动量的均值还可以直接表示为:

AVG(pₑ) = ∫ψ*( r) (– iħ∇) ψ(r) d³ r

拿到一个坐标表象的波函数 Ψ(r),与拿到经傅立叶变换后动量表象的波函数 ϕ(p),具有的信息是一样多的。海森堡借助上述数学框架,进一步研究了粒子位置、动量的标准差,提出了一个不等式:

Δ(r) * Δ(p) ħ/2

这就是大名鼎鼎的海森堡不确定性原则。它说明,粒子位置的不确定程度,总是与动量的不确定程度相反,两者乘积存在一个下限。

定性理解可以这样想,|ψ(r)|² 在空间上的非零区域越小,我们就越难“看清” ψ(r) 的辐角在空间上的周期规律,对波矢的计算就会越不准确;相反,如果 |ψ(r)|² 在空间上很平均分散,即粒子的位置有很大不确定性,我们反倒有机会在更大的空间范围内“看”到 ψ(r) 的辐角与 r 的关系,从中计算到更准确的波矢,也即粒子的动量。

记住这个静态对比图,读者应该对海森堡的不确定性原则就有了非常直观的理解。

海森堡的不确定性原则有力地阐释了微观世界的随机性,推进了哥本哈根诠释的形成。

9、薛定谔方程

含时薛定谔方程:

Ĥ ψ(r, t) = iħ ∂ψ/∂t

定态薛定谔方程:

Ĥ ψ(r) = E ψ(r)

———————————

在物质波概念提出后的2年内,尽管还没找到实验证据,科学家仅凭着纯理性思考,就已经建立了描述物质波的数学框架。但在这个优雅的数学框架中,粒子的位置、动量等力学量在观测前不再具有单一确定值,而只有由波函数决定的“分布”。这是一种全新的物理学,需要一整套与这个新框架适应的运动理论。

对于经典运动理论中各种常见的力学量,人们发现,在量子物理中都可以用波函数推导出其“分布”,进而得到力学量的均值、方差等,例如:

粒子角动量的均值:
AVG(r ×pₑ) = ∫ψ*(r) (– iħ r ×∇) ψ(r) d³ r

粒子动能的均值:
AVG(Tₑ) = ∫ψ*(r) (–ħ²∇²/2m) ψ(r) d³ r

可以看到,上述计算,包括对粒子位置、动量均值的计算,都是通过对波函数施加了一套运算而得到的。如果我们把积分中间的核心替换为算符,可得到一组力学量与算符的对应关系:

位置算符 = r
动量算符 = (– iħ∇)
角动量算符 =  (– iħ r ×∇) 
动能算符 = (–ħ²∇²/2m)

对于这些力学量,都有:

力学量的均值 = ∫ψ*(r) (代表力学量的算符) ψ(r) d³ r

一个崭新的力学体系似乎已经完成了一半,至少我们曾经熟悉的这些力学量,都在量子物理中有了代表。现在,我们只是缺少像牛顿力学中 F = ma 那样的运动定律。

薛定谔意识到了这个重大时刻必将到来,他日夜不停地推导着,希望找到量子世界中运动定律的新形式。由于这时相对论已经问世多年,他一开始雄心壮志地想建立一个符合相对论的量子力学,但没有获得满意结果。后来,他将精力集中于非相对论的情形。由于人们早就知道玻尔模型中外层电子的速度是光速的1/137,在这个速度下相对论效应较小,说明非相对论情形也可以有用武之地。

关于引入薛定谔方程的过程,可以有以下几方面考虑。首先,由于微观粒子的位置和力学信息都包括在 ψ 中,因此,运动方程也应该是关于 ψ 的偏微分方程。其次,我们知道 ψ 乘以任何非零系数,都不改变它的相对分布,都是同一个状态。因此,ψ 的偏微分方程也应该是线性方程。然后,对于物质波的频率 E/h,我们之前说 E 是粒子的总能量,但对于非相对论的情形,这里只考虑粒子非相对论的动能和势能(对于原子和分子中的电子,只有若干至几十 eV 的数量级)。粒子静止质量的质能(在 MeV 数量级)对应更高频率的单纯辐角振动,在波函数中抹去这些质能对应的高频振动,不影响分析电子在原子中的运动状态。因此,在薛定谔理论的波函数中,E 只包括非相对论的动能和势能。

对于可以分离变量的波函数:

ψ(r, t) = ψ₀(r) e^(-iEt/ħ)

ψ 对时间的偏导数为:

∂ψ/∂t = -iE/ħ ψ(r, t)

整理后可得到一个能量本征方程(左侧是算符作用于波函数,右侧是能量 E 乘以波函数):

iħ ∂ψ/∂t = E ψ(r, t)

而总能量 = 动能 + 势能

= ∫ψ*(r, t) (–ħ²∇²/2m) ψ(r, t) d³+ ∫ψ*(r, t) V(r) ψ(r, t) d³ r

= ∫ψ*(r, t) E ψ(r, t) d³ r

= ∫ψ*(r, t) (iħ ∂ψ/∂t) d³ r

故,应当有

(–ħ²∇²/2m) ψ(r, t) + V(r) ψ(r, t) = iħ ∂ψ/∂t

这样就得到了含时薛定谔方程。

如果把 [(–ħ²∇²/2m) + V(r)] 记为哈密顿算符  Ĥ,上式即化为:

Ĥ ψ(r, t) = iħ ∂ψ/∂t

或者像薛定谔的墓碑上刻的更简短的版本:

Ĥψ=iħψ’

这 7个 Unicode 字符,决定了各种势场下波函数的解,核外电子的运动特征、分子结构、化学性质,很大程度上都由它决定。有人说薛定谔方程是描述了生命的方程式,作者深以为然。

量子物理学之所以叫“量子”,是因为在这些理论中总有分立的离散值出现,就像普朗克的能量包、波尔的量子化条件、轨道的离散能级等等。在薛定谔方程出现前,量子化条件往往是作为“公设”人为引入的,人们总是说,这些量只能取离散值,才能符合观测结果。在薛定谔方程出现后,人们意识到量子化条件的出现不是偶然的,其背后更深层次的原因,就在于微分方程的解往往会呈现分立性。例如对于束缚态,能量的本征方程只有在 E 取特定系列的离散值时,方程才有具备物理意义的解。原来物理上的量子化是来源于数学的,这比唯象理论的解释要好得多。

在这个框架下,人们可以定量计算原子、分子外层电子的运动和力学特征,对原子谱线、激发态寿命进行更精确的理论解释。人们在势能壁垒问题中发现了“量子隧穿”效应,即粒子有一定概率出现在经典力学中不可能到达的位置。这种效应可以在一定程度上解释重原子核的 α 放射性和半衰期(认为 α 粒子被困在核力构成的势阱里,然而每时每刻都有一定微小的几率跃出势阱)。

在海森堡、薛定谔等人提出上述量子力学的框架之后,物理学迎来了一个大发展的时期,更多数学工具被引入物理,物理能够解释和预测的现象也越来越多。对于核力的研究,导致了人类进入原子能时代,也制造出了更具毁灭性的武器。这种物理学家“造出”的武器结束了第二次世界大战,也开启了一种新的国际政治博弈模式。

在另一方面,量子物理也被广泛应用于改变世界面貌的高新技术产业,凝聚态物理帮助人们了解和改善材料的性质,半导体元器件的出现让计算机、手机、智能设备变成了人人触手可及的商品,诞生于物理实验室中的衍射分析技术、隧道扫描技术,让人们发现了 DNA 的双螺旋结构,揭开了破解生物遗传密码的序幕。今天,人们已经开始对蛋白质等生物分子的生化反应过程进行“高清录像”,显示出具有原子分辨率的结构在反应中的变化与规律,这必将让我们更快地接近了解生命的真相。

而了解得越多,我们越确信,生命在物理上并无特别之处,处理生命现象的那个能级(最多几十 eV),甚至已经不是物理学的最新前沿。人类在目前自己能制造出来的任何设备装置中,已经很难找到违反已知物理学的现象。生命仅剩的最后一丝神秘,也很可能在数学进一步发展后(特别是人工神经网络理论),将荡然无存。这就是我们生活的时代,是这些科学发展道路上的智者,用严谨的数学工具抽丝剥茧,将世界以造物者的视角呈现在我们普通人的面前。

10组带领人们走向现代的物理公式(三)

6、卢瑟福-玻尔原子模型

玻尔角动量量子化条件:
|r × p| = N * h / 2 π

轨道能级:
E_N = – m e^4 / [2 N² (h/2π)² (4 π ε0)²]

玻尔模型与本文介绍的其他公式相比有一个最显著的特点,那就是它已经被认定是错误的。而且不是那种“在一般条件下仍然近似成立”的退而不休,是直接被后来的理论颠覆了根基。尽管这样,卢瑟福-玻尔的原子模型依旧是今天量子物理学必讲的课程,因为它体现了人们对量子世界认识的过程,也是对后续理论的重要启发。

在19世纪末、20世纪初,人们关于物质微观结构的概念来源于以下知识:首先,近代原子论在19世纪发展成熟,化学反应的倍比规律使人们相信物质有最小的基本组成单元;人们区分了原子、分子,发现了几十种化学元素,排列了元素周期表。1897年,汤姆生通过阴极射线在磁场中的偏转发现了电子,给出了电子的荷质比;1898年,卢瑟福用类似的方法区分了铀元素放射出的 α射线和 β射线;1909年,密立根通过油滴实验测到了元电量,证实了电子是离散的;1911年卢瑟福通过 α粒子散射实验证明了物质的正电荷和质量集中于很小的空间区域中,即原子核。至此,一个关于原子结构的模型呼之欲出。

显然,已知了原子由电子和原子核组成后,可想象的图景变得更加具体。在排除了汤姆生的原子结构枣糕模型之后,剩下的备选项还有行星模型、晶格模型等。其中,行星模型把原子内部想象成太阳系的样子,电子与原子核之间的库仑力提供了圆周运动的向心力。出于期待微观世界和宏观世界的“雷同”,人们天然地喜爱这个模型。但行星模型有个致命问题,根据经典电磁学,圆周运动的电子会辐射电磁波,轨道会逐渐变小,最终掉进原子核中。

很快,玻尔把新兴起的量子概念引入到原子模型中,提出了一种解释原子大小稳定性的理论。他假设电子绕原子核转动的角动量必须是 h / 2 π 的整数倍数,同时假设当且仅当体系内的动能+库仑势能发生改变时,才会辐射或吸收光子。

对于围绕氢原子核运动的电子(质量 m,电量 -e),根据库仑力等于向心力,有:

F = e² / r² / (4 π ε0) = m v² / r = p² / m / r

将上式与玻尔角动量量子化条件 r * p = N * h / 2 π 连立,有:

r_N = N² (h/2π)² * (4 π ε0) / m / e²

当 N = 1 时,推算出的氢原子半径约为 0.53 埃米,这与通过阿伏加德罗常数估算的原子尺寸数量级是吻合的。

更进一步,人们意识到,不同玻尔半径的轨道总能量(电子动能与它的库仑势能)可以很容易被表示出来:

E_N = Ek – V = p² / 2m – e² / r / (4 π ε0)

= – m e^4 / [2 N² (h/2π)² (4 π ε0)²]

当 N = 1 时,轨道总能量为 -13.6eV;第 N 层轨道的能量就是 -13.6eV 的 1/N²。电子在不同能量的轨道之间跃迁,需要吸收或释放的能量也可以确定,而根据 ΔE = h ν,玻尔模型能够预测原子的发射、吸收光谱。而当时人们对氢原子光谱的研究,已经有了很长的时间,并发展出了巴耳末公式、里德伯公式等经验公式。玻尔原子模型能够在很大程度上解释氢原子谱线的分布规律。因此,该模型提出后,被普遍认为已接近了原子结构的真相。

在巨大的成功之余,人们也清醒地看到玻尔理论有一些局限性。首先,在外推到解释其他原子光谱时,模型不再给出正确结果。即便是对于氢原子谱线,玻尔理论也不能解释谱线的精细结构,以及不同谱线的相对强弱。因此,玻尔本人也承认这只是一个过渡理论。

站在今天,我们已经知道,在这种圆周运动的图景中,电子的位置和动量同时具有确定值,违反了不确定性原则,该图景不符合微观世界的基本规律。玻尔模型能够解释一部分试验现象,有很大的巧合成分——它正好猜中了氢原子束缚电子的能级分布,事实上连角动量都没有完全猜对。基本上属于第一步就错了,但“撞大运”得到了正确答案的一角。将它推广到其他情景得到错误结果,也就不足为怪了。但这个幸福的错误,也有巨大功劳,它揭示了电子在原子中的运动也有量子化特征。这就促使物理学家对量子化背后的成因做了更大胆的思考。

7、德布罗意波

λ = h/p
ψ(x, t) = A e^[i (p·x – E*t) / (h/2π)]

到目前为止,我们对重大物理发现的叙述都是以时间线为依据的。如果讲述 1910年代物理学发展的成就,就不能不提爱因斯坦的广义相对论。然而广义相对论的难度显然过大,对于本文这类浅说 + 不严谨的娱乐性推导来说,实在是鹤立鸡群。因此,我们先沿着量子力学的主线前进,将时间跨越到 1920年代。

对于新诞生的玻尔原子模型,有科学家开始思考角动量的量子化究竟意味着什么。法国物理学家布里渊曾提出,电子围绕原子核运动并非不能辐射电磁波,而是它激发了原子核周围的“以太”产生波动,这种波动在电子轨道上形成驻波,造成最终没有向外释放电磁辐射;而驻波的波数必须为整数个,也解释了轨道半径的量子化。

这个古怪想法被一位同样离经叛道的博士生吸收,德布罗意在攻读朗之万的博士时想到,既然光可以兼有波动性和粒子性,那么传统认识中的微观粒子也可能兼有波动性,这就没有必要假设在电子轨道上存在“以太驻波”,电子本身就兼有波动性。同样,这一假说也能推导出玻尔量子化条件。

德布罗意同学把这个想法扩展成了他的博士论文,虽然篇幅不长,但这篇论文绝对堪称人类历史上对科学贡献最大的博士论文之一。无论是看在导师朗之万的面子上,还是确实震惊于文章的创造性,德布罗意的答辩委员会也对他的短文给予了高度评价。不过每年得到高度评价的博士论文成百上千,真正让德布罗意理论受到追捧的,还是来自爱因斯坦的热情肯定。

光波具有粒子性,而电子具有波动性,这种哲学上的思辨让爱因斯坦激动。尤其是“电子是一个粒子”的经典概念,仔细推敲的话,本身就只来源于人们的想象。回忆电子发现的过程,无非是人们发现了一束物质流,测量到它具有固定的荷质比,后来又证实了它有离散的质量、动量和能量。并没有任何实验证据表明电子有小球一样的形状,这纯粹是人们臆想的。那么,为什么不把它想象成类似于光子的样子 —— 光子同样有质量(相对论质量)、动量和能量,还同时具有一个波长。德布罗意是指出这种可能性的第一人,他的这一洞见力让后来的物理学家钦佩不已。

在德布罗意假说得到实验检验之前,由于受到爱因斯坦推动,就已经有不少物理学家开始认真思考德布罗意波的物理意义。既然物质也是波,那它是一种什么波,怎么表示,成了最基本的问题。

德布罗意虽未说明物质波是什么波,但对物质波的波长已经进行了讨论。尽管本节的第一个公式 λ = h/p 没有直接出现在德布罗意的论文中,但一般认为是德布罗意论文的显然推论。对于光子,这个等式就是 E = h ν ,E = m c²,p = m c,λ = c / ν 四个关系式的简单代入。对于电子,从“驻波假说给出玻尔量子化条件”的角度看,也可以理解为它是由玻尔条件 r*p = N*h/2π,以及 N*λ = 2πr (圆轨道一周有 N 个波长的驻波)两个关系式引出的。两者都只有初中难度,是本系列中最轻松娱乐的不严谨推导。

然而物理学家不会只满足于这样的轻松。由于人们早已为描述理论和工程中的各种波动现象,积累了相当完善的数学工具,关于物质波只给出一个波长未免太寒酸了。就像你家的豪华厨房有全套德国 Miele 的厨电,而打开冰箱发现只有一袋速冻饺子一样,太不让人得志。但要具体给出波动的物理量,又实在摸不着头脑。可见,在这么模糊的条件下猜测波函数的物理学家,真正是抽象能力极强的天才。

现在,让我们按事后诸葛亮的方式重演这个过程。我们要给物质波建立一个数学模型,但只知道其波长由动量决定,剩下的细节需要在尽量不添加多余元素的前提下“脑补”。首先,物质波既然是波,那就要有相位的概念,波的所经之处,每个位置的相位应该从 -π 到 +π 反复变化着,这是任何波都应该有的特征。第二,物质波应该是在空间上附着于粒子附近的 —— 当谈论核外电子的物质波时,我们显然关注的是在电子轨道附近的波动;当研究一个密闭盒子里的粒子时,我们也不希望它的物质波在别的不相关的区域。这样,我们很自然地要求物质波的“强度”有一个空间分布。在粒子的活动范围内,显然波的“强度”应该是高的,而在没有关系的区域,或是说粒子不可能抵达的区域,这个“强度”可以是 0。

依据这两个最自然的想法,构建物质波的数学框架,显然需要两个函数关系,一个是波的相位与位置、时间的函数关系,另一个是波的“强度”或“振幅”与位置、时间的函数关系。初中生可能会想到类似于 f(x, t) * Sin( g(x,t)) 这样的函数。这是一个很好的猜想,既有振幅,又有相位,并且都是位置与时间的函数。但还用厨房的比喻来说,这样的数学形式只能算个煤球炉子,用它做顿大餐着实有失体面。更好的工具是利用复数,复数的模对应波的“强度”,复数的辐角对应波的相位,这样我们用一个关于位置矢量 x、时间 t 的复函数 ψ(x, t) ,就可以表示一个满足上述需要的波。

那么 ψ(x, t) 有没有最简单的解析式呢,这是有的,不妨给出:

ψ(x, t) = A e^[i (k·x – ω*t)]

该式引入了复变指数 e^iθ 来表示波动的相位部分。这个 ψ(x, t) 函数的模永远是常数 |A|,而辐角是 arg(A) + (k·x – ω*t)。显然,函数的辐角变化在以波动方式传播,等相位(辐角)位置的传播关系为:

k·x – ω * t₁ = k·x – ω * t₂     →
(xx) = (t₂ – t₁) * ω k / |k

说明波速为 v = ω k / |k(相位传播速度)。

波长的矢量 λ = (2π / ω) v = 2π k / |k

再由德布罗意关系,波长 |λ| = h / |p|

故 kp / (h/2π)

又设定物质波的频率满足普朗克关系 E = h ω / 2π,有:

ω = E / (h/2π)

整理,得到:

ψ(x, t) = A e^[i (p·x – E*t) / (h/2π)]

至此,我们在仍然没有搞清楚物质波是什么的前提下,得到了一个具体的波函数。该波函数表示的是一个在空间各处“强度”相同的平面波,其波长满足德布罗意关系、频率满足普朗克关系。这个数学形式的波函数,也经常被称为德布罗意波。有了它,就像是冰箱里终于找到一块带着大理石花纹的牛肉,虽然不知道从那来的,甚至是真牛肉还是人造肉都不清楚,但至少可以满足一阵科学家的口腹之欲。

如果看解析式不够直观,本站做了一个动图辅助理解德布罗意波。物质波的分布用平面上阵列式的红蓝转盘表示 —— 每个转盘的位置是固定的,其直径表示此处物质波的模,转角表示物质波的辐角。为了看得清楚,程序把辐角在 0~π 的转盘渲染成红色,-π~0 的转盘渲染成蓝色。

上图中,转盘的直径不随位置改变,转角为 x*0.5 + y*0.25 – t*2π,正如一个动量为(0.5, 0.25)的德布罗意波。从图中很容易看到波长和波的传播方向。

注意在前述推导中,物质波的相位速度 v 并不是粒子的运动速度。可以看到,上面这个波的数学模型是“生拼硬凑”出来的,我们施加了波长满足德布罗意关系的要求,施加了频率满足普朗克关系的要求,这就使得它的相位速度也被决定了,而这个被决定的波速的物理意义并不是粒子的实际速度。

在实验物理学家那边,关于物质波的进展也是相当神速。其实在德布罗意答辩时,就回答了“如何在实验中检验你的理论”的问题。德布罗意给出了一个相当靠谱的回答,就是寻找电子在晶体中的衍射图像。在他毕业3年后,美国贝尔实验室的物理学家戴维孙成功得到了电子衍射图案,明确证实了电子存在波动性特征。德布罗意的成功,也成了人类理性思想取得伟大成就的标志性事例。

10组带领人们走向现代的物理公式(二)

4、狭义相对论质能方程

E = m c²

上篇讲到,麦克斯韦方程提出后,引起了一连串连锁反应。首先,光的电磁波本质说得到确立。其次,理论对光速为常量的预言,导致人们思考,这个求解得到的光速是参照的哪一个参考系。看似合理的以太参考系,遇到了试验的挑战,人们无法测量到地球相对于以太运动的速度。因此,又有人提出了相对以太运动会造成物体结构改变,出现“钟慢尺缩”的假说。

爱因斯坦对这个解释并不满意。他指出,假定存在一个绝对静止的参考系是多余的,因为并不能做任何实验分辨观察者是否处在这样的参考系中——即便某人碰巧处在相对以太静止的绝对参考系中,他也拿不出任何可以“炫耀”的物理证据。同时,假定物质结构受相对以太运动影响是不令人满意的,理论在没有描述物质结构的情况下,却给出了物质结构缩短的公式,这不属于公理化的思路。

爱因斯坦找到了一个更自洽、优雅的解读,他提出不需要假设存在以太和绝对静止系,只要符合两条原则,也能解释迈克尔逊-莫雷实验的零结果。第一条原则是相对性原理,即任何惯性(匀速直线)运动都只能被看作是相对的,在不同的惯性坐标系中,物理规律的形式都是相同的,因而不存在地位特殊的惯性系。第二条原则是存在一个不变速度 c,在任何惯性参考系下,光速永远为c;而任何两个有观测者的惯性参考系,其相对速度永远小于c。

根据爱因斯坦的理论,存在不变速度 c 是时空本身的性质。实际上这个 c 不一定跟电磁理论绑定在一起,只是人们率先在电磁学中发现了它。钟慢尺缩效应的电磁结构解释被抛弃了,取而代之的是(被观察的运动中的)时空本身可以(在外部观察者的视角中)伸缩的假说。

在“时空伸缩”假说下,洛伦兹变换的公式仍然相同,只是意义有区别。物理事件在外部观察者的坐标下为 (x, y, z, t),在动系中该事件的坐标要按洛伦兹变换变为 (x’, y’, z’, t’),如此坐标变换,麦克斯韦方程仍具有相同的形式,故无论外部观察者还是动系内的观察者,都不能通过电磁学实验找到其参照系的优越性。

爱因斯坦进一步分析,力学实验也应当服从狭义相对论的原则。在两个参考系中观察同一个碰撞实验,观察者都应当得到动量守恒定律,而这将导致出现“运动物体的惯性(质量)比它静止时大”的结果。

推导这个论断,一般是考虑下述情景:有两个在静止时完全相同的小球,观察者测得其静止质量均为 m0。后来,小球1 在外部作用下获得了速度 v(相对于观察者和小球2)、沿着质心连线向静止的小球2 飞去。这时,谨慎的观察者可以认为飞行中的小球1 惯性质量变为未知,记为 m1。再后来,两个小球发生对心正碰“粘”在一起,观察者看到结合体以速度 u 离去。观察者可以根据动量守恒,计算 m1:

m1 v = (m0 + m1) u  →
m1 = m0 u / (v – u) = m0 / (v/u – 1)       式(1)

假设还有一个“航拍器”跟踪飞行的小球1 且保持同速(但彼此分离),航拍器看到的景象是:小球2 以相反的速度 -v 向小球1飞来,然后结合体以速度 u’ 离去。根据系统的对称性,显然 u’ = -u。

如果我们都以碰撞时刻为坐标原点,那么结合体在观察者参考系和航拍器参考系下的运动轨迹分别是:

x = u * t
x’ = -u * t’       式(2)

而根据洛伦兹变换,两个坐标系的关系为:

x’ = γ (x – v*t)
t’ = γ (t – v*x/c²)       式(3)

将式(3)代入式(2),消去 x、t、x’、t’,可得到

-u * (1 – u*v/c²) = (u-v)

即 u² -2c²/v u + c² = 0           式(4)

又因 u < c,故此一元二次方程的解应取较小的一个,为:

u = c²/v – c²/v sqrt(1-v²/c²)
  = c²/v(1 –  sqrt(1-v²/c²))            式(5)

再计算式(1)中的分母 v/u – 1:

v/u – 1 = v²/c²/(1 –  sqrt(1-v²/c²)) – 1
= (v²/c²- 1 +  sqrt(1-v²/c²))/(1 –  sqrt(1-v²/c²))
= sqrt(1-v²/c²) (-sqrt(1-v²/c²)+1) / (1 –  sqrt(1-v²/c²))
= sqrt(1-v²/c²)

因此,式(1)化为:

m1 = m0 / sqrt(1-v²/c²)            式(6)

这就是狭义相对论中的质速关系。这个数量关系可以在粒子加速器中得到很高精度的检验,至今屹立不倒。在爱因斯坦提出狭义相对论之前,物理学家就已经发现了电子质量在极高速运动时会变大,只是没有合理的解释。是狭义相对论的提出,把洛伦兹变换、质速关系一并解决,因此成为爱因斯坦的成名作之一。

不过相信读者已经习惯了,事情总是没完没了,动量守恒解决了,难道质量守恒可以随便丢掉?速度增加导致质量增大是怎么回事?

就上边的例子而言,由于我们是通过系统外的作用把小球1 加速到 v,因此,显然应该怀疑是那个外部作用破坏了守恒律,因为那时的系统并不孤立。外力对小球1 做功,赋予了它动能,与此同时外部系统也会消耗相等的能量。

如果考察这个小球1 加速过程的微分,根据功和能量的定义,其微分为:dE = F ds

动量的微分为:dp = F dt

因此 dE = (dp / dt) * ds = v dp         式(7)

而 dp = d(m1 * v) = v d(m1) + m1 dv      式(8)

其中,d(m1) 可以通过对式(6)求微分得到:

d(m1) = m0 * (-1/2) * (1 – v²/c²)^(-3/2) * (-2v/c²) dv
= m1 * v / (c²-v²) dv            式(9)

式(9)代入式(8)得到:
dp = m1 (c²)/(c² – v²) dv

再代入式(7)、式(9)得到:
dE = m1 c² v/(c² – v²) dv = c² d(m1)          式(10)

由此看到,小球1 质量的增量 d(m1) 与注入它的能量增量 dE 有比例关系,比例因子为 1/c²。每注入一份能量 dE,小球的质量就增加了 dE/c²。而在没有能量注入和能量耗散时(碰撞粘合的动能损失也转化为内能,在不考虑能量辐射的瞬时,总能量仍保持不变,故对于结合体质量,我们直接用了 m0 + m1),质量(能量)守恒仍然是成立的。

对式(10)积分,可以知道动体的动能:

Ek = m1 c² – m0 c²

定义总能量 E = Ek + m0 c²,动体的质量 m1 记为 m,则有

E = m c²

这也就是大名鼎鼎的质能方程。

它暗示了物体的能量由其惯性质量决定,即使静止的物体,只要它有质量,也储存了一部分“质能”,而且这种质能惊人之大,足以制造原子弹和供给恒星在数十亿年里持续发光。在狭义相对论出现之前,化学家曾认真估算过太阳的寿命,最多只得到了几万年的结果,而在当时进化论已经出现,地质学也对地层沉积速度进行过分析,都认为几万年是不够解释地球的年龄的,狭义相对论的出现终于消除了这些困惑。人们对恒星能量来源的更深刻理解,也进一步削弱了各种“超自然论”的市场。

5、普朗克-爱因斯坦关系

E = h ν

现在让我们暂时把目光从相对论上移开,转到 1900年前后的另一桩奇事上,法拉第和麦克斯韦打开的魔盒还对热力学产生了影响。

在了解到电磁波能够穿越真空传递能量后,热辐射也有了更好的解释。人们假设物质内有一些振动的带电粒子对,无时不刻发出偶极辐射;同时,这些振子也能吸收空间中的电磁辐射能量,使体系处于热平衡之中。这种模型看上去十分合理,人们期待它能够解释观察到的各种热力学现象。

但是在试图解释黑体辐射规律时,电磁振子模型还是遇到了难以克服的困难。黑体是能够吸收各种波长的光与电磁波的物体。想象一个内部涂黑的厚纸盒,表面扎了一个小孔,各种波长的光进入小孔后,基本都被纸盒内壁多次漫反射并最终吸收,因此,这个小孔和它背后的体系就可以被看作一个黑体。当黑体被加热到一定温度时,反而会发散各种波长的辐射。这本身倒不神奇,因为那些在黑体中起到吸收辐射作用的振子,没理由不在高温时反过来释放电磁波。真正奇怪的是,黑体在每个波长段的辐射功率,呈现了特殊的规律,振子模型似乎不能解释。在紫外光区,按电磁理论预言的总辐射功率竟然是无穷大的,这显然说明模型中存在错误假设,而人们在很长一段时间内不知道错在哪里。这种“紫外灾难”被开尔文爵士称为“飘在物理学万里晴空中的乌云”之一(另一朵就是之前讲过的迈克尔逊-莫雷实验的零结果)。

到了1900年,人们已经通过精细实验积累了大量关于黑体辐射功率的数据,普朗克从数据中猜到了一个拟合很好的公式,而在此之前人们要用两个不同的公式来分别拟合红外区间和紫外区间。通过数据猜测公式听上去不算太难,但如果读者看到普朗克猜中的公式的形式,还是会大吃一惊:

E(λ, T) = (8πhc / λ^5) / (e^(hc / λkT) – 1)

在电子计算器都还未出现的年代,能猜中这么复杂的式子,不得不钦佩普朗克扎实的数学基本功。普朗克在 1900年10月19日向德国物理学会提交了他的初步成果。单单这一发现,就至少可以收获一个以他名字命名的公式。但普朗克更加巨大的成就,还在于他用“世纪之光”般的洞察力找到了公式背后的解释。在思考了8个星期之后,普朗克发现,如果“绝望地”假定自然频率为 ν 的振子必须以 h ν 为单位一份一份地吸收和释放能量时,上述黑体辐射公式就可以被推导出来,紫外区的辐射总功率也随之变为一个收敛的积分。

普朗克在 1900年12月14日的德国物理学会会议上报告了这个发现,因此,这一天被普遍视为量子物理学的诞生日。

颇具戏剧性的是,普朗克本人并没有立即意识到这个发现的重要性。相反,在之后很长一段时间内,他还是坚持认为“能量包”只是一个数学上的处理手段,而不是物理实在,“能量包”背后应有经典电磁学的解释。直到十余年后,经过无数次失败的尝试后,他才确信经典物理学是无法解释他发现的黑体辐射公式的。

普朗克的这种“保守”并不是没有意义的,正像他自己说的,那些试图挽救经典物理的失败尝试,恰恰印证了发展新理论的必要。

在普朗克困惑于量子现象没有经典解释时,爱因斯坦则敏捷地把这个假说应用到了另一个领域中,解决了一个同样困扰物理学家的问题,这就是光电效应的解释。

光电效应是一个不太困难的实验,科学家发现,当光照射到一些用绝缘物支起的金属表面时,有可能会让金属带上正电。进一步分析表明,这是由于光照让电子从金属表面逸出。实验物理学家又深入研究了光源和逸出电子的关系,结果发现,单个逸出电子的能量竟然和光强无关,而是由光的频率决定的——当用高频率的紫外光做实验时,逸出电子的能量较大,而用低频率的光做同样的实验,无论光强多大、功率多高,单个逸出电子的能量都较小,甚至根本无法产生光电效应。这也是一个经典电磁学不能解释的现象。

爱因斯坦从普朗克对黑体辐射的解释中得到启发,他提出金属表面的电子也是一份一份地吸收光能,“能量包”的最小单元正是普朗克提出的 h ν。若要电子从金属中逸出,必须一次性吸收大于 W 的能量,否则,电子马上又会释放掉刚吸收的能量 h ν,形成漫反射现象。根据这个解释,逸出电子的动能可以被准确预测,为:

Ek = h ν – W

该式可以被实验检验,在技术上几乎没有什么难度。

爱因斯坦把普朗克的“能量包”假说更是大胆推进一步,他宣称,粒子一份一份地吸收、释放光能,并不是简单的数学处理,或是背后有经典机制,而是光(电磁波)本身携带的能量就是一份一份的,每一份能量可以看作一个光子。只有把光视为光子的洪流,光电现象和黑体辐射现象才能被合理解释。同时,这种光子又不同于牛顿臆想的光子颗粒,仍然具有波长、频率等波的特性,是一种具有波粒二象性的能量子。

根据狭义相对论的质能方程,可以预见光子具有质量:

E = h ν = m c²     →   m = h ν / c²
以及动量  p = h ν / c = h / λ

爱因斯坦的光子说,再一次震动了物理界。光电效应的实验事实简单明了,理论分析又首尾相接、自圆其说。这时人们才认识到,普朗克引入的量子概念,竟然不止是热力学分支中的一个计算工具,而具有普遍的物理意义,它为人们开启了通往新的物理学的大门。

光子说、狭义相对论、质能方程都是在 1905年一年之内发表的,这一年也被称为爱因斯坦的奇迹年,在物理学的历史上,注定是极不平凡的。此时距离麦克斯韦和法拉第的历史性会面,仅仅过去了 45年。在这 45年间,除了发生了上述我们讲到的科学故事之外,爱迪生发明了留声机(1877)和实用的电灯(1880),奔驰生产出了第一辆内燃机汽车(1887),巴黎建成了埃菲尔铁塔(1889),波波夫、特斯拉、马可尼等人发明了无线电发报机(1894~1896),莱特兄弟驾驶飞机飞上了天空(1903),《泰晤士报》开始通过越洋无线电从美国向英国传递新闻(1903)。世纪之初的人们显然已经做好了迎接崭新世界的准备,而在这个舞台上,物理学家已变得举足轻重。

在下一篇,我们将看到一大批新生代的物理学家走进普朗克和爱因斯坦打开的大门,向世人展示了一个不可思议的微观世界。

10组带领人们走向现代的物理公式(一)

大千世界,纷繁复杂。鸟儿在天空中飞翔,叶子在秋风里变黄飘落,人们坐在家里读书思考。一切看起来是那么自然,又是那么神秘而精妙。就在几百年前,一些智者拿起了笔和算纸,借助着原始的测量工具、试验仪器,开启了对自然规律的精细探索。

可以想象,当他们要做这件事时,谁也不敢奢望能够把世界改造成今天的模样。他们只是忠实地记录了试验数据,并以最天才的眼光,发现了其中令人震惊的数学规律。

以下这10个发现,就是这样的例子。当这些发现被公之于众后,人们不再依靠煤油灯读书,马匹从交通工具变成了观赏动物,大洋两端的人可以随时面对面聊天,生命的奥秘也被逐渐揭开。下面,就让我们再欣赏一下这些伟大的发现。

1、麦克斯韦方程组
∇・E = ρ/ε0
∇・B = 0
∇×B = μ0 (j + ε0 ∂E/∂t)
∇×E = -∂B/∂t

1860年,29岁的麦克斯韦带着他的《论法拉第的力线》来到英国皇家科学院,拜访了已经年近70岁的法拉第教授本人。即便法拉第在那时早已是显赫的科学巨匠,他提出的力线和场的概念,仍然被当时的物理学家认为是离经叛典。法拉第善于用热情形象的语言和比喻解释科学概念,他在科学院举办的科普讲座总是座无虚席,甚至维多利亚女王的丈夫经常带着王子来旁听。但法拉第在数学方面相当薄弱,这与他早年不幸的辍学经历有关,因此他关于力场、力线的深刻见地,只能用图形语言进行描绘,而被相当一部分物理学家所怀疑。

麦克斯韦则更像一个典型的“学神”,从小学到大学一路开挂,具备扎实的数学功底。他在1855年左右经导师推荐,研读了法拉第关于电磁力线的学说,并在大量实验后认识到了这一理论的精妙。之后,麦克斯韦开始着手用准确的数学语言重建法拉第的理论。

我们上边看到的这4个方程是微分形式的麦克斯韦方程组,它和麦克斯韦在1860年代给出的积分形式的方程组是等价的。由于形式上更简洁,因此入选为本文中第一个伟大公式。

这组方程囊括了经典电磁学中全部的实验发现——方程一对应了高斯定理,电场的散度正比于电荷密度;方程二表示磁场的散度总为零,意味着不存在磁单极子;方程三表示电流和变化的电场可以产生有旋的磁场;方程四表示变化的磁场可以产生有旋的电场。

本文假定读者是已经学完高中理科课程和一部分大学先修课的中学生。有的读者可能不熟悉公式中的微分符号,这里做一个简要的介绍。


倒三角符号 ∇ (读作 nabla)可以被看成是一个特殊的“矢量”,只不过这个“矢量”的分量不是数值,而是微分符号:

∇ = (∂/∂x, ∂/∂y, ∂/∂z) ,每个分量都是对相应坐标求偏导数的算符。

对于一个关于坐标 x, y, z 的标量函数 f(x, y, z),将 ∇ 作用于f,∇f 就是 f 对三个空间坐标的偏导数组成的矢量 (∂f/∂x, ∂f/∂y, ∂f/∂z),∇f 也叫做 f 的“梯度”。形象地看,梯度指向函数取值增大最快的方向。人们常说的温度梯度、浓度梯度,就是以温度、浓度等物理量作为空间位置的标量函数,然后应用这一概念。

下图显示了一张太阳内部温度分布的示意,在某个等温面上,温度梯度垂直于等温面、指向高温的内部核心,如图中箭头所示。这些箭头就是在那些位置上,温度梯度的矢量。


既然把 ∇ 看作一个矢量,那么矢量可以有点乘叉乘的计算。两个矢量做点乘,得到一个标量,也就是把对应分量先相乘,再求和,如:

∇・E =  (∂/∂x, ∂/∂y, ∂/∂z)・(Ex, Ey, Ez) = ∂Ex/∂x + ∂Ey/∂y + ∂Ez/∂z

∇ 点乘一个矢量场,就称为这个矢量场的“散度”。为什么称它为“散度”,从下图中可以看出原因:

对空间中某处的一个小体积元 dx dy dz,我们可以表示出在这个体积元的 6 个外表面上,场的向外发散的总通量是多少。显然,作为一个闭合面,场的横穿而过的、不变的部分(Ex、Ey、Ez)“进出抵消”,不形成通量。而微分增量部分(黄色小箭头)将形成向外的通量,数值为:

dΦ = dEz dx dy + dEy dx dz + dEx dy dz

单位体积(dV = dx dy dz)上新增的对外发散通量 dΦ/dV 显然正好等于 ∂Ex/∂x + ∂Ey/∂y + ∂Ez/∂z,这就是散度的定义。也就是说,散度单位体积上场的新增发散通量

这样,不难理解,∇・E = ρ/ε0 就是微分层面的高斯定理,即小体积元中包裹的电荷量,决定了这个小体积元表面对外发散的电通量。而 ∇・B = 0,也就是闭合曲面磁通量总是 0 的微分版本。


对于 ∇ 和一个矢量场叉乘的情况,也可以有类似的分析。

两个矢量做叉乘,得到的是一个新的矢量 —— 也称它们的外积。如果是两个三维欧氏空间中的矢量,外积的方向和两个矢量形成的平面垂直(并按右手定则确定方向正反),外积的大小等于两个矢量构成的平行四边形的面积,这是几何上的解释。

可以顺便提一下,前边介绍的点乘,也称为矢量的内积,在几何中的含义可以理解为两个矢量先往某一者的方向上投影,再把投影的大小做乘积。

由于我们说 ∇ 的分量都是微分算符,很难去把它想象成几何空间中的矢量。因此,我们只能回顾叉乘在代数中的定义。从代数上来说,矢量 A、B 的叉积 A×B 可以按各个分量的运算定义:

A×B = (Ay Bz – Az By, Az Bx – Ax Bz, Ax By – Ay Bx)

这个运算看起来好像比点乘要复杂得多,实际上,二者恰好有完全相反的逻辑:点乘是把两个矢量所有对应的分量做乘积,并把结果加在一起;而叉乘是把两个矢量所有不对应的分量做乘积,并把结果写在得数不对应的分量上。

再展开说,被乘数、乘数、得数,都要“来自”或“去”不同的分量,而乘积的正负性,取决于被乘数、乘数、得数的分量的指标排序,如果是 x-y-z 这种排序,那乘积取正值,每交换一对指标,就改变乘积的正负号。这是一个按“全反对称”方式组合的分量的乘积,在代数和几何中都有着深刻的意义。

按上面定义,将 ∇ 叉乘一个矢量场,就可以给出其代数关系:

∇×E =  (∂/∂x, ∂/∂y, ∂/∂z)×(Ex, Ey, Ez)
= (∂Ez/∂y – ∂Ey/∂z, ∂Ex/∂z – ∂Ez/∂x, ∂Ey/∂x – ∂Ex/∂y)

∇×E 称为矢量场 E 的“旋度”,旋度的大小反映了场在这个点附近新增涡旋的程度:

我们还是看小微元 dx dy dz,先看 dx dy 平面,以四条边楞为闭合路径,场在逆时针回路上投影的曲线积分为:

E∙dl = (∂Ey/∂x – ∂Ex/∂y) dx dy

和前边分析类似,Ex、Ey 不变的部分在路径上“顺”、“逆”抵消,只留下微分增量部分对闭合曲线积分的结果有影响。

这个数值表示的是场在 dx dy 平面上新增的逆时针环量,环量方向记为 dx dy 平面的法线方向,也就是 z 方向。

可见,“旋度”表达式反映的是场在单位空间上新增环量的多少。这样也就可以理解,后两对麦克斯韦方程是感生电磁场和电流产生磁场的微分版本。


可以看到,麦克斯韦方程和在中学物理里熟悉的库仑定律、安培定则是很不一样的,它并不是直接给出场强在空间中分布的函数,而是给出场在任何一个微元的微分,如果你想求解不随时间改变的场的分布的话,还要去做积分。初看来又麻烦又不直观,但实际上,库仑定律、安培定则只是在场不随时间变化时成立,一旦遇到时变的电磁场,这种超距观念就不再正确了。

法拉第一直想通过实验否证电磁力传播的超距观念,但在当时的技术条件下,想在实验室里发现以光速传播的电磁场变化的时差,是极其困难的。

在1860年那次会面中,法拉第亲切地勉励了年轻的麦克斯韦。虽然不清楚年迈的法拉第能否理解麦克斯韦引入的数学方法,但至少法拉第认可了麦克斯韦对电磁力线学说的理解。法拉第鼓励道,“你不应该只满足于用数学解释我的理论,你应该超越它!”

在1865年,麦克斯韦辞去教授的职位,专心整理关于电磁学的理论,并在1873年正式出版了《电磁学通论》。麦克斯韦将百年来人们发现的电磁学实验规律,高度综合在一个统一、优雅的数学框架中,其成就不亚于牛顿对力学定律的综合。正是在麦克斯韦的理论上,人们才能更自信地驾驭奇妙的电磁现象,发明出各种彻底改变世界的产品。

不过在那个年代,能够熟练掌握麦克斯韦的数学工具的科学家和工程师尚且不多,从理论的诞生到验证花了惊人的二十余年时间。以至于麦克斯韦并没有在有生之年得到应有的荣誉,也没有等到他预言的电磁波被发现。而在今天,一个5岁的孩子就能按照电子积木的说明,拼插出发射和接收电磁波的电路,不能不让人感叹科技发展的代差。

2、电磁波波速
c = 1 / Sqrt(μ0 ε0)

严格来说,这个公式是麦克斯韦方程组的推论。作为一个推论,再次入选本文10大公式,也并不为过,因为它揭示了光和电磁波在本质上是同一种现象。

早在完成电磁波的推导之前,麦克斯韦就发现了真空中的光速 c 和真空中的电介常数 ε0、磁导率 μ0 的唯象关系。加之1845年法拉第发现磁场能改变介质中传播的光的偏振,敏感的物理学家能够察觉到,光与电磁现象必定存在某种内在的联系。法拉第在一次科学院公众讲座上就讲到了这个问题,他颇有远见地预言,电场和磁场的交替震荡应该能够在空间中传播开来,也许光就是这样的电磁波动。这种朦胧的猜测,最终被麦克斯韦以严密的数学予以证明。更令人赞叹的是,麦克斯韦理论得出的电磁波传播速度,果然就是上面那个唯象公式。

在今天,推导电磁波的波动方程,已经成了本科生的课堂练习。最简单情形,可以只分析没有电荷和电流的传播空间,这样在麦克斯韦方程中,电荷密度 ρ 和电流密度 j 都恒为 0,即:

∇・E = 0
∇・B = 0
∇×B = μ0 ε0 ∂E/∂t
∇×E = -∂B/∂t

将 ∇×( ) 作用于方程三左右两边:

对于等号左侧,又有 ∇×(∇×B) = ∇(∇・B) – ∇2 B = – ∇2 B

等号右侧,有:
∇×(μ0 ε0 ∂E/∂t) = μ0 ε0 ∂(∇×E)/∂t = -μ0 ε0 ∂2B/∂t2

因此,有 ∇2 B – μ0 ε0 ∂2 B /∂t2 = 0

同理,将 ∇×( ) 作用于方程四左右两边,也可以推导出:

2 E – μ0 ε0 ∂2 E /∂t2 = 0

这就是电磁场的波动方程。为了求解方便,可以考虑一个波动仅沿 x 方向传播的平面波的特殊情形,即:

Ex = Ez = 0
Bx = By = 0
Ey = Ey(x, t)
Bz = Bz(x, t)

代入波动方程,有:

2 Bz /∂x2 – μ0 ε0 ∂2 Bz /∂t2 = 0
2 Ey /∂x2 – μ0 ε0 ∂2 Ey /∂t2 = 0

很容易验证,

Bz(x, t) = B0 sin(ωt – ωx / c + θ0)
Ey(x, t) = B0 c sin(ωt – ωx / c + θ0)
其中 c = 1 / Sqrt(μ0 ε0)

是上述方程组的解。且若要两个位置 x1、x2 上的相位相等,即

ωt1 – ωx1 / c + θ0 = ωt2 – ωx2 / c + θ0

则时间的差(相位的传播时间)应当为:

t2 – t1 = (x2 – x1) / c

显然,c 也就是等相位平面的传播速度。

事情到这里还不算结束,我们得到了一个电磁波的速度,但还没有弄清它是相对于哪个参考系的速度。由于这个速度是我们通过麦克斯韦的微分方程组得到的,显然,它应该是相对于让麦克斯韦方程成立的那个参考系的速度。等等,难道麦克斯韦方程不是对所有参考系都成立?!这是曾经让物理学家发生过困惑的问题。

发现这种困惑并不难,在运动的参考系中,电场、磁场会发生变化,即使不知道麦克斯韦方程,也是理所当然的。比如我们知道运动的电荷会产生磁场,就像直导线产生的磁场那样;但如果观察者和电荷一起以同样的速度运动,那对观察者而言就没有运动的电荷,也就理应没有磁场。再比如在静止的地面上有一个恒定的磁场,那么在相对地面运动的参考系中,必然会因切割磁感线产生感应电场。由此看来,一个点的电场、磁场强度,不仅和坐标 (x,y,z,t) 有关,还应该和参考系的选择有关。

因此很自然地,人们认为电磁波速为 c 的参考系应该是一个特殊的参考系,比如相对于电磁波的波源静止,或者相对于传播电磁波的介质静止。而在其他参考系中,我们应该测量到大于或者小于 c 的电磁波传播速度——这是最习以为常的伽利略速度叠加原理的推论。因此,麦克斯韦方程在伽利略变换下,会具有不同的形式。

先被排除的是波源速度会影响电磁波波速(光速)的假设,首先这违反波动力学常识;其次,用一个很简单的天文现象就可以否证它——人们能观测到遥远的双星绕转,说明两颗星发出的光速是一样的,否则经过漫长的距离,必然有一颗星的光先到,另一颗星的光后到,显现出异常的表观影像。

那么似乎只剩下电磁波波速(光速)相对于传播介质的速度为 c 一种可能了。问题是,在宇宙空间中,是什么介质传播了电磁波?人们开始假设一种以太物质充满了空间,恒星、行星在以太中穿梭,不会扰动以太的分布(否则夜晚星空的影像将极不稳定)。这样,公转中的地球是绝不可能与以太保持时时静止的,因此在地球上不同方向的光速会有不同,体现了地球与以太的相对速度。

1887年迈克耳逊和莫雷设计了一个巧妙的干涉装置,希望观察到不同方向光速差引起的干涉现象。但结果证明,光速在不同惯性系和不同方向上都是相同的。在他们之后,大量物理学家重复了这个实验,进一步证实了各种测量地球与以太相对速度的尝试都只能得到零结果。光速似乎在任何惯性参考系下都保持为 c。这让人们大为惊奇,速度叠加原理竟然在光速问题上失效了!这一发现很快将引起一场理论物理的革命。

3、洛伦兹变换
x` = γ (x – v t)
y` = y
z` = z
t` = γ (t – v x / c2)
其中 γ = 1 / Sqrt(1 – v2 / c2)
带 ` 的量是在动系中的坐标

为了解释迈克耳逊-莫雷实验的零结果,人们首先想到的是检视实验装置本身。1889年,乔治菲茨杰拉德提出了一个天才的想法,他假设物质都是由带电粒子组成的,相对于以太运动能改变物质粒子之间的静力平衡,使运动方向上的量杆缩短。在一个运动参考系中的人和测量工具都会发生这种尺寸收缩,因此,他们自己是察觉不到的,只有在外部的另一个参考系中,才能发现这种尺缩。尺缩正好抵消了光速的变慢,从而使在动系中测到的光速也是 c。

1895年,洛仑兹发展了量杆缩短的假说,他进一步假设运动的时钟也会变慢。与尺缩效应一样,运动中的人的新陈代谢、实验过程和时钟都同步变慢,也是自己察觉不到的,只有在外部参考系才能发现。而量杆和时钟的变化率,可以通过光速不变的要求反推。

按洛仑兹的假说,能够得到一组匀速运动参考系之间的坐标变换公式。在洛仑兹坐标变换下,麦克斯韦方程将保持形式不变,因此解得的电磁波传播速度均为 c。

钟慢的变化率可以按上图的图景推导,假设有一个光源、镜子、接收器组成的系统,以速度 v 沿垂直于仪器的方向移动。光源(接收机)和镜子之间的距离是 L = sqrt(c² – v²) T1/2,光从发出到被接收器探测到,为一个时钟周期。

先看与仪器一起运动的观察者的视角(也称这个运动物体的“固有视角”),在他看来,光的行程就是原路垂直折返(2L`),因此,他认为一个时钟周期耗时是:

T` = 2L`/c = 2L/c = 2 sqrt(c² – v²) T1/2 / c

这是“固有视角”下“物体自己”感知到的时间流逝量,因此也称为“固有时”。须注意,上面还隐含了一个条件,即垂直于运动方向上的空间尺度不发生伸缩(L` = L)。

从外部参考系的观察者看,从上图中可见,运动的钟的时钟周期延长到了 T = 2T1/2

因此,时钟的变化率 T / T` = γ = 1 / Sqrt(1 – v2 / c2)

T 是外部参考系“录得”的时间流逝量,比动系中(“固有视角”下)的“固有时” T` 要长。

对于尺缩效应则,则可以通过这个装置沿运动方向摆放的情景来推导,如下图所示。

在外部参考系中,光源(接收机)和镜子的距离是 L,显然外部参考系看到的一个时钟周期:

T = L/(c – v) + L/(c + v) = L * 2c / (c² – v²) = 2 (L/c) / (1- v²/c²)

根据刚才得到的时钟变化率关系,可以知道动系里的时钟固有时 T` 比 T 短(外部观察者测得的时钟周期长):

T` = T * sqrt(1- v²/c²) = 2 (L/c) / sqrt(1- v²/c²)

再根据动系中的观察者测得光速也是 c 这个要求,可以推算出,在动系里的光源(接收机)和镜子的距离(量杆的原长度)应为:

L` = c T` / 2 = L / sqrt(1- v²/c²)

可见外部观察者测得的量杆长度 L 比动系中的 L` 短。

L`/L = 1 / sqrt(1- v²/c²) =  γ

为了接纳新诞生的麦克斯韦方程,并适应以太观测速度的零结果,物理学家竟然假设了一个之前从未在实验中发现的“钟慢尺缩”效应,不得不赞叹这些科学家大胆的想象力。

但也应该看到,在爱因斯坦提出相对论解释之前,洛仑兹变换的理论解释是较为怪异的。虽然它说对了动体要收缩,但是找了一个涉及到物质结构静力平衡的薄弱假说去解释这种收缩,这是有损理论普遍性的。在1900年前,人们对物质结构的认识本来就很模糊,原子核都是十几年后才发现的。那么追问下去,是哪些力的静力平衡决定了量杆的长度,这类问题无法回答,也就不能从静力平衡出发推导出洛仑兹变换的正确公式。上文的推导,只是基于测到光速不变的试验结果的反推,因此该假说最多算一种唯象理论。

在下一篇,我们将看到爱因斯坦首先找到了一个对洛仑兹变换更自洽的解释,他的解释彻底颠覆了牛顿以来人们对力学的观念,甚至让普通民众都感到仿佛触摸到了一个可畏的神秘新世界。


洛伦兹变换的几何图像

熟悉线性代数的读者知道,上文中洛伦兹变换的公式,是一个线性变换。

如果把时间 t 和空间位置坐标 x, y, z 合成为一个 4×1 的列向量:
X = (c * t, x, y, z)ᵀ

洛伦兹变换可以写成矩阵运算的形式:

X` = [ γ,     – γ v / c, 0, 0
            – γ v / c, γ,    0,  0 
            0,        0,       1,      0
            0,        0,       0,      1 ]  X

逆变换:

X = [ γ,      γ v / c, 0, 0
            γ v / c, γ,    0,  0 
           0,        0,       1,   0
           0,        0,       0,   1 ]  X`

带 ` 的量是在动系中的坐标。

显然,上述变换是四维空间中的线性变换。变换矩阵非常简单对称,比方程形式的公式还更好记。而且很容易计算,此矩阵的行列式等于 γ² – γ² v²/c² = 1。

在线性代数中,我们知道,线性变换和几何图像有着密切的关系,可以理解为“对空间中的几何图像进行了一次操作”,例如旋转、放缩等。而且,行列式为 1 的矩阵在用于线性变换时,不改变“图形”的“体积”。那么洛伦兹变换的几何意义是什么呢?

为了直观理解,本站制作了几个动图。

我们忽略掉数值不发生变化的 y、z 坐标,把 c*t 作为坐标横轴,x 作为纵坐标轴,这样 c t – x 空间描述了外部参考系中的“事件”所处的时间、位置。

我们让一只 Scratch 小猫(黄色)“遍历” 这个坐标系,从原点向外做放射线“运动”。这个“动”是要打引号的,因为它只是代表了遍历一系列时空坐标点(事件),而不一定代表某个物体的真实运动轨迹(显然,只有横坐标轴上下 +/- 45° 锥形区域以内的射线可以作为低于光速运动的物体的轨迹;恰巧为 +/- 45° 的射线,可以代表光的运动轨迹)。

对于运动的参考系,同一个事件的坐标将按洛伦兹变换确定,也就是我们动图中紫色小猫所处的位置。我们可以看到,紫色小猫将在另一个放射方向上“游历”。

我们让黄色小猫均匀地“遍历” ct-  x 坐标系中所有方向的时空坐标点(不留轨迹),而只留下紫色小猫的“轨迹”。这样,我们就能清楚地看到洛伦兹变换将原先的时空变成了什么形状。

先是 v=0 的情况,这种情形下两个坐标系完全重合,相当于绘制了原先时空坐标系中,各个方向的均匀放射线:

而对于动系的速度 v>0 的情况,根据洛伦兹变换,每个点的时空坐标在运动的参考系中,将改变位置,形成了新的图案:

动图更加直观(v/c 从 0 增加到 0.4):

这样,我们就能很直观地理解洛伦兹变换的几何图像了。通俗一点说,洛伦兹变换就像一种剪切变换,两个坐标轴(t、x)像剪刀刃似的剪向二-四象限。

可以看到,在这个剪切变换的过程中,有4条射线的方向是不变的,那就是 x = +/- c * t,在我们的图中用黄色进行了标记。这正是光速在洛伦兹变换下是不变速度的体现。

而刚才提到,由于洛伦兹变换矩阵的行列式为1,因此变换前后任何“图形”的四维体积也是不变的,这一点也能从动图上直观的感受到(变换后的平行四边形面积不变)。