自从伏尔泰笔下的那颗苹果砸到了牛顿以后,科学的发展就进入了快车道。提起牛顿 (Isaac Newton),许多人的第一印象往往是他的三大运动定律,以及万有引力。然而,从历史的角度看,牛顿最大的贡献在于,他告诉人们,自然界是存在规律的,并且这些规律是可以被科学方法所揭示的。从此,科学进入了历史舞台。在接下来的 200 多年里,一代又一代科学家通过大量的实验获知了各类定律。此时,物理学的画风大概是这样的:

  • 牛顿 (Newton) 运动定律
  • 万有引力定律
  • 热力学第 n 定律
  • 斯涅耳 (Snell) 定律(折射定律)
  • 库伦 (Coulomb) 定律(静电相互作用)
  • ‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧

这一阶段,物理学和其它科学并无二致,均是通过大量的实验和观察,总结各领域的定律。很长一段时间以来,物理学家都认为不同的自然现象遵循各自的规律,互不关联,直到……

1820 年,丹麦物理学家奥斯特 (Hans Ørsted) 发现,当给导线接通电流后,附近的一台指南针发生了异常的偏转。这一现象引起了物理学界的高度关注。在安培 (André-Marie Ampère)、法拉第 (Michael Faraday) 等物理学家的努力下,我们发现电和磁是存在一定的关联的,并发现了些许零散的电磁相互作用定律。

1864 年英国物理学家麦克斯韦(James Maxwell)将当时物理学界已发现的电学、磁学以及电磁相互作用的各类定律抽象成了一套统一的电磁理论。紧接着,人们又发现自然光其实是一种电磁波,于是又把波动光学纳入了电磁领域。自此,物理学家构建了一个包含了电学、磁学和波动光学的电磁帝国。

电磁统一理论的巨大成功给予了当时的物理学家极大的启发。人们发现,表面上看来完全不同的现象背后可能遵循的是同样的一套物理学规律。于是,一个庞大的计划诞生了。在接下来的数十年里,人们把与物质的运动及引力相关的现象都写进了广义相对论,把与热相关的现象写成了统计理论。然后,物理学就变成了这个样子:

  • 一切和电磁有关的现象均可以被电磁理论描述
  • 一切和质点运动及引力相关的现象均可以被广义相对论描述
  • 一切和热有关的现象均可以被统计理论描述
  • ‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧

然而这并不是故事的结尾。人们很快又发现,这些支配了各自领域的理论之间仍然存在相似之处。于是物理学家又开始了新一轮的抽象。这次,我们得到了拉格朗日动力学 (Lagrangian Dynamics)。与其说拉格朗日动力学是一套理论,不如说它是一种理论生成器 (theory generators),是物理学理论的基本范式。它包含了一套算法,在给定一个拉格朗日量 (Lagrangian,通常记为 ) 之后,就能自动生成一套物理学理论。在拉格朗日动力学的世界里,你只需要令 = F² / 4 (其中 F 是电磁场),你就得到了麦克斯韦的电磁理论;你只需要令 = R (其中 R 是时空曲率),你就得到了广义相对论。是的,你只要给出一个拉格朗日量,就能获得一个对应的理论 (P.S. 再对拉格朗日量做个路径积分,你还可以得到对应的量子理论)。

从现实角度看,把定律抽象成理论,再把理论进一步抽象为拉格朗日动力学的做法似乎并没有很大的意义,因为它们并不产生任何新的结论 — 原来的定律能描述的现象,抽象后的理论依然只能描述这些现象。事实上,拉格朗日动力学的雏形早在牛顿的时代就出现了,也是因为这个原因被冷落了数百年。而这一现状,即将被一位出色的女性数学物理学家改写。

1918 年,德国女数学物理学家诺特 (Emmy Noether) 发表了一篇名为 Invariante Variationsprobleme 的论文。在论文中,诺特证明了一条著名的定理 (而后被命名为诺特定理):连续的对称性导致守恒量。从现代物理的角度上看,这无疑是理论物理学中最重要的一条定理,没有之一。对称性对于物理学理论来说几乎是底线级的要求,尤其是关于时间和空间的对称性。所以这一定理意味着几乎所有物理学理论中均存在守恒量,而且我们可以用诺特定理给出的一套标准程序把它们找出来!

首先澄清一点,这里的对称性,指的是在某一变换下不变的性质。例如,如果一套理论具有关于时间的对称性,意味着这套理论在改变了理论中的时间参数后不变。所以你可以想象,如果一套理论没有关于时间的对称性,那么相当于这理论一天变一个样。并不是说你写不出这样的理论,而是说一套今天能用明天也许就原地爆炸的理论实在没有什么存在的必要。同样的逻辑对空间也适用。一套躺床上能用到了办公室就罢工的理论就没资格被称为理论。

所以,一套合格的物理学理论至少要有对时间和空间的对称性。而根据诺特定理,这些对称性意味着理论中有守恒量。猜猜时间对称性对应的守恒量是什么?正是能量!由此,能量守恒定律不再只是“历史上大量实验所证实的定律”,更是一条具有坚实理论基础的定理。更准确地说,现代理论物理的逻辑是这样的:一套合格的物理理论需要对时间的对称性,诺特定理可以根据这一对称性给出对应的守恒量,而我们就把这一守恒量定义为能量。

简单总结一下,我们最早根据实验得到了一些定律,然后发现定律之间存在一些联系,从而可以被抽象为理论;然后又发现理论之间存在相似之处,于是又抽象成了理论生成器。反过来,给定理论生成器中需要的量 (比如拉格朗日量),它就能自动给出一套理论,再将理论用于具体的情境,我们又可以重新得到相应的定律。


但即便有了诺特定理,我们的拉格朗日动力学似乎还是不够强大。原因是,如果我们发现了任何新的现象,我们似乎还是只能按照老路,从定律做起,一步步抽象成理论和拉格朗日量。那么有没有什么方式可以越过这些繁琐的步骤,直接获得拉格朗日量呢?答案是肯定的。这方面的探索直接造就了 20 世纪辉煌的高能物理学。

在此之前,我们首先要了解的是拉格朗日量里都有些啥。通常情况下,拉格朗日量中包含某个物体 (比如某个粒子) 的坐标 x,或某种场 (比如电磁场) 的强度 A,以及它们的导数。一个量的导数,通常用符号 ∂ (读作 partial) 来表示,代表了这个量的变化率。例如,∂ₜ x 表示坐标 x 对时间 t 的导数,也就是位置随时间的变化率,也就是速度。而场则既可以随时间变化,也可以随空间变化,所以对场的导数一般记为 ∂ᵤ。通常拉格朗日量由两部分组成,一部分含有导数,被称为动能项;另一部分完全没有导数,被称为势能项。

接下来我们列举一些常见理论的动能项,来看看它们之间有什么共同之处:

  • 粒子,或忽略了形状大小的一般物体 (质点),x 为它的坐标:
  • 标量场 (激发粒子物理中的希格斯玻色子,引导核反应的介子等),φ 为它的场强:
  • 旋量场 (可以激发粒子物理中的质子、电子、中子、夸克等),𝜓 为它的场强:
  • 电磁场,A 可被视为场强:

无论你看不看得懂这些动能项的含义,但至少你能注意到一点,所有的这些动能项都包含不超过两个导数。那么能不能有哪个理论的动能项含有超过两个导数呢?答案是不能。我们可以直接从理论上推知,含有超过两个导数的理论的能量没有下界,它描述的无论是粒子也好还是场也好,都将无止境地向具有负无穷能量的状态演化,从而根本无法给出任何有效的结论。学术上,我们管它叫 Ostrogradski 不稳定性。理论的动能项不能包含超过两个导数是一个极大的限制,再考虑到对称性,可能成立的动能项其实已经寥寥无几。

接下来,我们再来看势能项。势能是不包含任何导数的,所以我们通常可以进行泰勒 (Taylor) 展开。以一个标量场 φ 为例,所谓泰勒展开,就是可以把它的势能项写成下面这个样子:

其中所有的 λ 都是常数。标量场 φ 右上角的数字代表它的次方,比如 φ³ 就是 φ 的 3 次方。把势能写成这个样子有什么好处呢?为了解答这个问题,我们需要知道物理学中量纲的概念。拉格朗日量的量纲一般是 +4,而标量场则是 +1,多个标量场相乘 φⁿ 的量纲便是 +n 。物理学理论中,所有相加的项都必须有相同的量纲。为了保证这一点,这些常数 λ 就必须要有不同的量纲。以 λ₃φ³ 这一项为例,φ³ 的量纲是 +3,为了保证整体上有 +4 的量纲,λ₃ 的量纲就只能是 +1;再以 λ₅φ⁵ 为例,φ⁵ 的量纲是 +5,为了保证整体上有 +4 的量纲,λ₅ 的量纲就只能是 -1 。

这些常数 λ 的量纲有什么用呢?现代的重整化群方法告诉我们,如果一个项前面的常数 λ 的量纲为正数,那么它的数值将随系统能量的降低而上升,这种项被称为相关的 (relevant);如果是负数,那么它的数值将随系统能量降低而下降,这种项被称为不相关的 (irrelevant);如果是 0,那么都有可能,这种项叫边缘的 (marginal)。

所以你可以看到泰勒展开的作用了。我们目前研究的绝大部分物理系统的能量都是比较低的,所以只有相关的 (最多再加上一个边缘的) 项前面的常数 λ 会比较大,而所有不相关的项则会被乘上一个很小的常数 λ 从而使其可以被忽略。通常情况下,相关的项只有有限个,边缘的项只有一个。以上面的标量场为例,只有 λ₀,λ₁φ,λ₂φ²,λ₃φ³ 是相关的,λ​₄φ⁴ 是边缘的,其余的所有项都是不相关的。因此,在大多数情况下,我们至多只需要这 5 项就可以足够精确的描述标量场相关的物理。

如果你顺利地坚持到了这里,我相信你可以明白这样一件事:由于种种限制,合理的拉格朗日量其实并没有多少。所以我们完全可以通过排除法,排除不合理的拉格朗日量,而剩下的就是这个自然界有可能遵守的仅有的几种自然规律。利用这种方法,20 世纪后半叶,高能物理学家在完全没有实验证据支持的情况下,仅通过上述的各种理论上的推理,预言了大量尚未被发现的粒子:

  • charm 夸克:1964 年由 Sheldon Glashow, John Iliopoulos 与 Luciano Maiani 预言,1974 年在 斯坦福线性加速器 (Stanford Linear Accelerator Center, SLAC) 中被发现
  • down 夸克:1975 年由 Haim Harari 预言,1977 年在费米实验室 (Fermilab) 中发现
  • top 夸克:1975 年由 Haim Harari 预言,1995 年在费米实验室 (Fermilab) 中发现
  • 希格斯玻色子 (Higgs boson):1964 年由 Peter Higgs 预言,2012 年在欧洲核子中心 (CERN) 大型强子对撞机 (Large Hadron Collider, LHC) 中被发现
  • 其它数十乃至上百种复合粒子

这是物理学界在过去数百年来的高光时刻。在这几十年里,高能物理学家们像上帝一样,在没有实验数据提示的情况下,仅通过理论上的推理,便得知可能存在的粒子以及它们可能的基本性质。这些理论上的结果甚至能比实验上的观测提前了接近半个世纪。如今,拉格朗日量 (以及它的亲戚哈密顿量) 已经几乎成为了所有前沿理论物理研究的标配。

就先讲这么多,希望大家可以感受到现代理论物理工具的强大。通过拉格朗日动力学,我们可以高屋建瓴地做一些推断,得到一些对许多不同的理论都适用的结论。我们不需要知道拉格朗日量的太多细节,就可以依据诺特定理断言守恒量的存在。对于更高阶的一些理论,比如量子场论和弦理论,也一样。虽然我们现在对弦理论还知之甚少,不过已经足以让我们推测量子引力和量子纠缠很可能是一回事 (所谓的 ER=EPR 猜想)。我们可以对拉格朗日量进行细致的分析,从而判断哪些形式可以带来哪些结果。因此,对于现在的理论物理学家来说,与其说我们是在根据现实寻找规律,不如说我们是在尝试设计一些理论。正如我们提到的,合理的拉格朗日量要受到诸多的限制,否则就会出现问题。这些探索的经历让我们知道,这个自然界之所以有这些规律,这些规律之所以有这样的形式,都不是空穴来风,它们背后都是有更深层次的原因的。这也是为什么理论物理吸引了如此众多的顶级智力为之工作。

 

13
3