美妙的理论

时间：2023-02-14 理论教育版权反馈

【摘要】：令我们感觉美的物理学理论有哪些特征？一个精美的证明或计算没有一点儿多余的复杂的东西，而能达到有力的结果。一个理论的方程能否得到精美的解，对理论的美并不重要。爱因斯坦和牛顿的引力理论都包含着决定一定物质产生的引力的方程。这样的判断是物理学家普遍赞同的，而且我们也看到了，人们当初接受爱因斯坦的理论主要也因为这一点。简单而外，还有一种性质能让物理学理论美起来——理论能给人一种“不可避免”的感觉。

当我的心片刻凝固

在一朵花或一片流云，

透过那微茫的光辉

能窥见永恒的影。

H·沃恩，静思^[99]

1974年，现代量子电动力学创立者之一的狄拉克来哈佛讲他的历史性工作。讲话快结束的时候，他转向我们的研究生，告诉他们，只需要关注他们方程的美，而不要去管那些方程是什么意思。对学生来说这算不得好建议，不过寻找物理学的美始终贯穿着狄拉克的工作，而且实际上也贯穿着整个物理学的许多历史。^[100]

关于美在物理学中的作用，有时说起来不过是装腔作势。我不想拿整个这一章来为美说更多的好话；我倒想重点谈谈物理学理论中的美的本质，谈谈为什么我们对美的感觉有时能起指导作用，有时却不能；谈谈美感的作用为何是我们向着终极理论进步的标志。

物理学家说一个理论美，跟人们说一幅画、一支曲子或一首诗美，那意思是不大一样的。那不单是个人对美的愉悦的表达，而更像一个驯马人看见一匹赛马说，它是一匹好马。驯马人表达的当然是他个人的感受，但说的是一个客观事实：凭驯马人难以言说的评判标准，它就是那种能赢的马。

当然，不同驯马人对马的判断可能有所不同，正因为这一点才会有赛马。但驯马人的美感是为了达到一个具体目标——选出一匹能赢的马。物理学家的美感也是为着一个目标——为着帮助物理学家抉择哪些思想能带我们去解释自然。物理学家和驯马人一样，他们的判断可能对也可能错，但他们都不光是为自己快乐。他们是常常让自己高兴，但那不是他们美学判断的全部目的。

这样的比较生出的问题，比它回答的更多。首先，什么样的理论是美的？令我们感觉美的物理学理论有哪些特征？还有一个更难的问题：物理学家的美感为什么起作用？什么时候起作用？前一章讲的故事说明了一个很奇怪的事实，某些跟我们的美感一样既个人又客观的东西不但能帮助我们发现物理学理论，还能帮助我们判断哪些理论是成功的。为什么美学的眼睛给我们带来那么多运气呢？为了回答这个问题，我们会遇到一个听起来很寻常、实际上更艰难的问题：物理学家想实现什么？

什么样的理论是美的？美国艺术博物馆的馆长曾对我在物理学中用“美”这个词感到愤慨。他说，在他们的工作中，专业人员已经不再使用这个词，因为他们发现要定义它真是太难了。很久以前，数学家兼物理学家的庞加勒就承认“可能很难定义数学的美，但任何一种美也都如此。”

我不想定义美，正如我不会去定义爱或者怕。我们不定义这些事情；当我们感觉到了，就会知道它们。然后，除了这点而外，我们有时还能描述它们，现在我就来试试。

我说物理学的美，当然不是说那些印在纸上的数学符号很美。玄学派诗人特拉赫恩（Thomas Traherne）就煞费苦心把他的诗行整整齐齐地印出来，^[101]但那与物理学没有关系。还应该区别我这里所说的美与数学家和物理学家常说的那种叫“精美”的特质。一个精美的证明或计算没有一点儿多余的复杂的东西，而能达到有力的结果。一个理论的方程能否得到精美的解，对理论的美并不重要。除了最简单的情形外，广义相对论的方程是出了名的难解，但这无损于理论本来的美。据说，爱因斯坦曾讲过，科学家应该把精美留给裁缝师们。

简单是我说的美的一部分，不过那是思想的简单，不是说方程或符号少的那种机械的简单。爱因斯坦和牛顿的引力理论都包含着决定一定物质产生的引力的方程。在牛顿的理论中，方程是3个（相应于空间的3个方向）——在爱因斯坦的理论中，方程是14个（我指的是10个场方程加上4个运动方程）。这一点根本不能拿来作为牛顿理论比爱因斯坦理论更美的依据。实际上，爱因斯坦的理论更美，部分原因是他关于引力和惯性等效的那个核心思想很简单。这样的判断是物理学家普遍赞同的，而且我们也看到了，人们当初接受爱因斯坦的理论主要也因为这一点。

简单而外，还有一种性质能让物理学理论美起来——理论能给人一种“不可避免”的感觉。听一支曲子或一首小诗，我们会感觉一种强烈的美的愉悦，仿佛作品没有东西可以更改，一个音符或一个文字你都不想是别的样子。在拉斐尔的《圣家族》里，画布上的每个人物的位置都恰到好处。这也许不是你最喜欢的一幅画，但当你看这幅画的时候，你不会觉得有任何需要拉斐尔重新画的东西。^[102]部分说来（也只能是部分的）广义相对论也是这样的。一旦你认识了爱因斯坦采纳的一般物理学原理，你就会明白，爱因斯坦不可能导出另一个迥然不同的引力理论来。正如他自己说的，关于广义相对论，“理论最大的吸引力在于它的逻辑完整。假如从它得出的哪一个结论错了，它就得被拋弃；修正而不破坏它的整个结构似乎是不可能的。”^[103]

牛顿的引力理论似乎不是这样的。如果天文学的观测数据需要，牛顿可以假设引力随距离的立方而不是平方反比例地减小，但爱因斯坦却不能把立方反比的定律纳入自己的理论，除非打碎它的理论基础。这样，爱因斯坦的14个方程具有不可避免的特征，从而也具有牛顿的3个方程所缺乏的美。我想，这就是爱因斯坦自己的意思——他说，在广义相对论的引力场方程中，包含引力场一端的是美的，像大理石雕塑成的；而方程的另一端，包含物质的那一端，仍然还是丑的，像木头做的。引力场以几乎必然的方式走进爱因斯坦的方程，但广义相对论却不能解释为什么物质还带着那样的形式。

在基本粒子的强力和弱力的现代标准模型里，我们也能部分（仍然只是部分）看到同样意义的必然性。广义相对论和标准模型的必然性和简单性，具有共同的特征：它们都服从对称性原理。

简单地说，对称性原理指的是从一定的不同的角度看某个事物都是一样的。在所有这样的对称性中，最简单的是人类面部的近似的左右对称。因为脸的两边几乎没有什么差别，所以不论从正面看，还是从镜子里看左右颠倒了的脸，它都是一样的。做电影的常玩这样的把戏，让观众突然惊奇地认出一张他们在镜子里见过的脸；假如人像比目鱼那样在脸的同一边长着两只眼睛，就不会有那样的惊奇了。

有些事物比人的脸有着更大的对称性。立方体从6个相互垂直的不同方向看，或者颠倒它的左右来看，都是一样的。理想的晶体不但从不同方向看是一样的，在晶体内部的不同位置（相隔一定距离）看，它也是一样的。球从任何方向看都是相同的。虚空的空间从不同方向和位置看，也是相同的。

这样的对称性千百年来愉悦和激发着艺术家和科学家，但从没在科学中发挥过重要作用。我们很熟悉食盐，那是一颗颗的小立方晶体，从6个不同的视角着都一样，不过这一点并不太重要。两侧的对称对人的脸面来说也不是最重要的。对称性在自然界里最重要的不在于事物的对称，而是定律的对称。

自然定律的对称说的是，当我们改变观察自然现象的角度时，我们看到的自然定律不会改变。这样的对称性通常叫做不变性原理。例如，不论我们的实验室在什么方向，我们发现的自然定律都有相同的形式；不论我们相对于北方、东北方或者向上、向下去测量，都不会有什么不同。对古代和中世纪的自然哲学家来说，这并不是显然的。在日常生活里，上下和水平方向当然是不同的。只有在17世纪现代科学诞生以来，人们才明白，下不同于上只是因为在我们的下面碰巧有个大质量的东西——地球，而不是（像亚里士多德想的那样）因为轻物体要自然上升，重物体会自然下落。注意，这个对称不是说上与下是一样的；从地球表面向上或向下测量的观察者，对下落的苹果有不同的描述，但他们发现的定律是相同的，苹果是因为大质量的地球的吸引而下落的。

即使我们的实验室固定在某个地方，自然的定律仍然具有相同的形式；不论我们的实验室在得克萨斯、瑞士或者银河对岸的其他行星，结果都不会有什么同。不论怎样调节时间，自然的定律也都有相同的形式；不论从穆罕默德逃亡那天还是从基督诞生那年或者宇宙开始那一刻算起，都没有什么不同。^[104]这不是说事物都不随时间变化，也不是说得克萨斯就跟瑞士一样，只是说在不同时间和不同地方发现的定律是相同的。假如没有这种对称性，那么在每一个新实验室、在每个正在流逝的瞬间，科学工作都得从头做起。

任何对称性原理同时也是一个简单性原理。假如自然的定律确实在方向中区分出上下南北，那么我们就不得不在方程里考虑某些与实验室方向相联系的东西，它们相应也就不会太简单。其实，为了让我们的方程尽可能简单和紧凑，数学家和物理学家就是假定空间的所有方向都是等价的。

自然定律的对称性在经典物理学中当然重要，而更重要的还是在量子力学。想想，电子是靠什么彼此区别开的？那只能是它的能量、动量和自旋。除了这些性质之外，宇宙间的每个电子都是相同的。就是电子的这些性质，刻画了电子的量子力学波函数在对称变换下（如改变时钟的定时方法，改变实验室的位置或方向）的响应。^[1]这样，物质在物理学中失去了中心的地位：留下的只有对称性原理和波函数在对称变换下可能的不同行为方式。

比那些简单的平移或旋转更不容易觉察的还有时空对称性。不同速度运动的观察着看到的自然定律仍然具有相同的形式；不论我们在哪儿做实验，在以每秒几百千米绕着银河中心飞旋的太阳系，还是在以每秒几万千米匆匆离我们而去的遥远星系，都不会有什么不同。这最后一种对称性原理有时叫相对性原理。一般认为这个原理是爱因斯坦创立的，但在牛顿的力学理论中也有一个相对性原理；两个理论的区别仅在于观察者的速度对位置和时间的观测结果的影响方式。不过，牛顿认为他的相对性原理是理所当然的，而爱因斯坦则把他的相对性原理与一个实验事实协调起来了：不论观测者如何运动，光速都是相同的。从这个意义说，爱因斯坦在1905年的狭义相对论论文中把对称性作为一个物理学问题来强调，标志着现代对称性思想的开始。

在牛顿理论和爱因斯坦理论中，观测者的运动都会影响观测者在时空里的位置，两者的最重要差别在于，在狭义相对论中说两个事件同时发生是没有意义的。一个观测者可能看到两个钟在同一瞬间指向正午；另一个相对于他运动的观测者会发现一个钟比另一个钟先敲响12点。我们以前讲过，这一点使得牛顿的引力理论和任何其他类似的力的理论跟狭义相对论相矛盾。牛顿理论告诉我们太阳任意时刻作用在地球上的引力都依赖于同一时刻太阳的质量，但那时刻是相对谁说的呢？

为了避免这个问题，最自然的方法是拋弃原来牛顿关于瞬时超距作用的思想，代之以一幅因为场产生的力的作用图景。在这样的图景里，太阳不直接吸引地球；它产生一个场，即引力场，然后场生成一个作用于地球的力。这个区别看起来似乎没什么不同，实际上却是大大的不同：太阳爆发耀斑时，开始只影响附近的引力场，然后引力场的微小改变才以光速向空间传播。那仿佛水池的微波，从小石头落下的地方开始向四周散开。所有以不变速度运动的观测者都会看到相同的景象，因为在狭义相对论里他们都相信光速是一样的。同样，一个带电物体产生一个场，即电磁场，它将电磁力作用于其他带电体。如果带电物体突然运动，起初只有它附近的电磁场发生改变，然后这些改变才以光速在场中传播。实际上，在这种情形，电磁场的改变正是我们寻常所说的光，不过，它们的波长通常都太长或者太短，我们看不见。

在量子物理学以前的背景下，爱因斯坦的狭义相对论很好地符合一种自然的二元观：自然界存在两样事物，一种是粒子，如普通原子的电子、质子和中子；另一种是场，如引力场和电磁场。量子力学带来了更加统一的观点。在量子力学看来，像电磁场那样的场的能量和动量是以一束束的形式出现的，那就是我们知道的光子，它的行为跟粒子完全一样，只是碰巧没有质量罢了。同样，引力场的能量和动量也是以一束束引力子的形式出现的，也是无质量的粒子。在大尺度的力场，如太阳的引力场，我们注意不到单个的引力子，主要是因为它们太多了。^[2]

1929年，根据波恩、海森伯、约当和威格纳以前的研究，海森堡和泡利在两篇文章里解释了有质量的粒子（如电子）也能理解为不同类型的场（如电子场）的一束束能量和动量。在量子力学里，两个电子间的电磁力源于光子的交换；同样，光子与电子之间的力是源于电子的交换。物质与力之间的差别基本上消失了；任何粒子都可以充当某个力的作用的检验者，而它们的交换也能产生其他的力。今天人们晋遍认为，结合狭义相对论原理与量子力学的惟一途径是通过场的量子理论或其他类似的理论。这完全是一种逻辑的刚性，为真实的基本理论赋予了美：量子力学和狭义相对论几乎是不相容的，它们在量子场论里的调和为粒子的相互作用方式带来了有力的限制。

现在为止，上面提到的所有对称性只是限制了理论应该包含的力和物质的类型——没有从它们本身来要求存在哪种特殊类型的物质或力。20世纪以来，特别是近几十年来，对称性原理提高到了新的更重要的水平：我们有了那样的对称性原理，它们正好决定了所有已知自然力的存在。

在广义相对论中，作为基础的对称性原理说明一切参照系都是等价的：对所有的观测者，不论匀速运动的还是加速的或旋转的，自然定律看起来都是相同的。假如我们把实验装置从大学宁静的实验室搬出来，拿到稳定旋转的木马上去做实验。现在我们不去测量相对于北的方向，而要测量相对于固定在转盘上的马儿的方向。乍看起来，定律会显得大不一样。在旋转木马上的观测者会感觉一个离心力仿佛要把马儿上松散的东西甩出去。如果他们出生成长在木马上，他们不会知道自己是在一个旋转的平板上面，他们会用一些包含那种离心力的力学定律来描述自然，那些定律跟我们其他人所发现的定律是迥然不同的。

静止参照系和旋转参照系的自然定律看起来是那么不一样，令牛顿和后来200多年的物理学家大为困惑。19世纪80年代，维也纳的物理学家和哲学家马赫（Ernest Mach）指出了一条可能通向解释的道路。马赫强调，除了离心力而外，还有东西能区别旋转木马和传统的实验室。从木马上的天文学家的观点看，太阳、恒星、星系——实际上连宇宙这个大块——都在绕着天顶旋转。你我会说那是因为木马在旋转，但生活在马上而且当然拿它做参照系的天文学家则坚持认为是整个宇宙在绕着他旋转。马赫问，这个巨大明显的物质旋转是否以某种方式与离心力相关呢？假如那样，木马上发现的自然定律跟其他传统实验室发现的自然定律就真是一样的了；表面的差别只是由于不同实验室的观测者看到的环境不同。

爱因斯坦捡起马赫的线索，在广义相对论里把它更具体化了。在广义相对论里，确实存在来自遥远星体的影响，产生旋转木马的离心力：那就是引力。在牛顿的引力理论中当然不会发生这样的事情，它考虑的只是任意物体间的吸引力。广义相对论更加复杂，在旋转木马的观测者看来，宇宙物质绕天顶的旋转产生一个场，有点儿像电磁体线圈中的电流产生的磁场。旋转木马参照系里的这个“引力磁场”产生的效应，就是寻常参照系里归因于离心力的效应。广义相对论的方程，也不像牛顿力学的那些方程，它们在旋转木马和一般实验室里的形式是完全相同的；不同实验室所看到的现象的区别仅在于他们的环境不同——一个看到宇宙在绕着天顶旋转，另一个宇宙没有旋转。但是，假如引力不在了，这种离心力解释将是不可能的，那么在旋转木马上感觉的离心力使我们能够区别旋转木马和一般的实验室，这样也就排除了旋转和不旋转的任何实验室之间的等价性。于是，不同参照系之间的对称性需要引力的存在。

弱电理论背后的基本对称性更奇怪一些。它跟空间或时间的视点改变无关，而是关于不同类型的基本粒子的识别。我们知道，在量子力学中，一个粒子可能处于那样的状态，不在这里，也不在那里；或者它的自旋不是顺时针的，也不是反时针的。同样奇怪的是，在量子力学里，可能有那样的粒子，它不是确定的电子，也不是确定的中微子，只有等我们测量了能够区分二者的某个性质（如电荷），才能认定它是什么。在弱电理论中，如果在方程里处处以这种既非电子也非中微子的混合粒子态来取代电子和中微子，自然定律的形式是不会改变的。因为其他许多不同粒子也跟电子和中微子发生相互作用，所以同时需要把那些粒子族也混合起来，^[3]如上夸克与下夸克，还有光子和它的伙伴：带正电和负电的W粒子、中性的Z粒子。这是与电磁力相联系的对称性，源于光子的交换；对弱核力来讲，那种对称来自W粒子和Z粒子的交换。在弱电理论中，光子、W粒子和Z粒子分别表现为4种场的能量束，那些场是对弱电理论的对称性的响应，就像引力场响应广义相对论的对称性一样。

弱电理论背后的这种对称性叫内在对称性，因为我们可以把它们与粒子的内在性质而不是外现的位置和运动联系起来。内在对称性比作用在寻常空间和时间的那些对称性（如广义相对论的对称性）更加陌生。我们可以想象，每个粒子都带着一个小刻度盘，盘上刻着“电子”、“中微子”、“光子”、“W”等粒子，指针指向这些粒子或者指向任意两个粒子之间。内在对称性说的是，当我们以一定方式转动刻度盘时，自然定律会表现出相同的形式。

另外，对这些主宰弱电力的对称性，我们可以在不同的时间和地点对不同的粒子转动刻度盘。这很像广义相对论里的对称性，不仅允许我们以一定角度、或者随时间增大的角度转动实验室，还允许我们把实验室搬到旋转木马上去。自然定律在这种依赖于时间和空间的对称变换下的不变性叫做局域对称性（因为对称变换的效应与空间位置和时间有关）或规范对称性（纯粹是历史的原因）。^[4]引力成为必然，正是因为空间和时间的不同参照系之间的这种局域对称性，同样的道理，光子、W粒子和Z粒子的场之所以必然出现，也因为一类新的局域对称性：电子与中微子之间的（还有上夸克和下夸克以及其他粒子之间的）局域对称性。

还有一类精确的局域对称性，跟夸克的一种内在性质相关，我们充满想象地把那种性质叫做夸克的色。我们已经看到有不同类型的夸克，如构成在所有寻常原子核中都能看到的质子和中子的上下夸克。另外，每种夸克都表现出3种不同的“色”，物理学家（至少在美国）通常称为红、白、蓝三色。^[105]当然，它们跟普通的颜色没有一点儿关系；不过是用来区别不同夸克个体的标签。就我们现在的认识，在不同色间确实存在精确的对称性。红夸克和白夸克间的力与白夸克和蓝夸克间的力是一样的；两个红夸克间的力与两个蓝夸克间的力也是一样的。但这种对称性不仅限于色的相互交换。在量子力学里，我们可以考虑那样一种状态的一个夸克，它说不定是红，是白，还是蓝。假如我们用3种可能的混合色（如紫色、玫瑰色和淡紫色）的夸克来取代原来3种色的夸克，自然定律还会有完全相同的形式。即使那些混合夸克从一个地方移动到另一个地方，从一个时刻移动到另一个时刻，自然定律都不会发生改变。再拿广义相对论的类比来说，我们一定能在理论中得出一族与引力场类似的与夸克相互作用的场。这种场有8个，叫做胶子场，因为它们产生的强力把夸克黏结在质子和中子里。我们现在关于这些力的理论，量子色动力学，不过就是夸克和胶子关于这种局域色对称性的理论。基本粒子的标准模型就由结合了量子色动力学的弱电理论组成。

我一直在说对称性原理为理论带来了某种刚性。你可能认为这是一种缺点，物理学家想发展能描述更多现象的理论，所以他们应该寻求尽可能有弹性的理论——能在各种不同的可能的条件下有意义的理论。在许多科学领域是这样的，但在基础物理学中却不是。我们在追寻某种普遍的东西——它统治着整个宇宙的一切现象——我们所谓的自然律。我们不是要去发现一个能描述自然粒子间所有可能的力的理论。实际上，我们只是期待着那样一个理论，它能让我们严格描述几个力——引力、弱电力和强力——那几个碰巧存在的力。我们物理学理论中的这种刚性是我们认为美的一部分。

给理论带来刚性的不仅是对称性原理。仅从对称性原理的基础出发，我们不可能走到弱电理论或量子色动力学，至多我们能得到更大理论的一个特例，有着无限多的可调节参数，它们在理论中可以取任何你喜欢的数值。为了从其他更复杂的满足同样对称性原理的理论中选出我们简单的标准模型，需要附加一个限制条件：出现在理论计算中的无穷大应该被清除。（就是说，理论必须是“可重正化的”。^[106]）结果表明，这个条件给理论的方程带来了极大的简单性，而且，跟各种局域对称性一道，它将走出一个形式独一无二的基本粒子的标准模型。

我们在物理学理论如广义相对论或标准模型中看到的美，很像某些艺术作品具有的美，它们都令我们感觉是必然的、自然而然的——我们不愿意改变其中的一个符号、一个笔画或一根线条。不过，正像我们欣赏音乐、绘画和诗歌一样，那种自然的感觉是一种趣味和体验，不可能从公式推导出来。

劳伦斯·伯克利实验室每隔一年出版一本小册子，列出最新的已知基本粒子的性质。如果我说统治自然的基本原理就是基本粒子具有小册子所列的那些性质，那么我们当然可以说基本粒子的已知性质是那个基本原理的自然结果。这个原理甚至还有预言的能力——它预言我们实验室产生的每一个新电子或质子都将表现出列在小册子上的质量和电荷。但这原理本身却太丑了，没人会觉得它实现了什么。它的丑陋在于不简单，也不自然——小册子里有成千上万的数字，任何一个都可能改变而不会使其余数据失去意义。没有什么逻辑的公式能在美的解释与单纯的数字罗列之间画出截然可分的界线，但是我们知道它们是不同的——一个原理有了简单性和刚性，我们才会认真看待它。这样，我们的美学判断不是发现科学解释并判断其有效性的最终惟一的方法——它是我们所谓解释的一个部分。

有些科学家笑话基本粒子物理学家，因为所谓的基本粒子太多了，我们都得随身带上一本伯克利的小册子，时刻让我们想起已经发现的那些粒子。但粒子的多少并不重要。正如萨拉姆讲的，大自然计较的不是粒子和力，而是原理。重要的是拥有一组简单经济的原理来解释为什么粒子是那样的。眼下令人烦恼的是，现在还没有一个我们希望的完整的理论。假如我们有了那种理论，它描写多少种粒子或力都无所谓，只要描写是美的，是简单原理的必然结果。

我们在物理学中看到的美的样式是很有限的。如果用语言来表达，我只能说那就是简单性的美和必然性的美——完美的结构，一切都恰到好处地组织在一起，没有需要改变的东西，存在一种逻辑的刚性。那是简约和古典的美，是我们在希腊悲剧里看到的美。但是，我们在艺术里发现的美却不止这一种。莎士比亚的戏剧就不具备这样的美，尽管他的某些十四行诗还有。莎剧的导演常常会省略一些台词。在奥利弗的电影《哈姆雷特》中，哈姆雷特从没说过“我真是好一个无赖，一个下贱的奴才！……”^[107]但是表演还是好的，因为莎翁的戏不像广义相对论或《俄狄浦斯》那样具有简约完美的结构；^[108]它们是杂乱的复合体，用戏的复杂来反照生活的复杂。这是莎翁戏剧美的一个方面，在我看来，在这方面它比索福克勒斯的戏剧和广义相对论的美更高级。莎翁戏剧里某些最了不起的因素，是他拋弃了古希腊悲剧的模式，在主角的命运展开之前，让我们先看到一个外来的小人物——如看门人、园丁、卖无花果的人或者掘墓的人。当然，理论物理学的美在艺术面前会显得很可怜，尽管那样，它还是给我们带来了快乐和指南。

在我看来，物理学是艺术的拙劣样板，还有另一方面的原因。我们的理论很深奥——当然是这样的，因为我们不得不用数学语言来发展那些理论，而数学语言还没有成为受教育者的普遍工具。物理学家一般也不愿意看到我们的理论那么困难。另一方面，我偶尔听到艺术家们高谈他们的工作，说只有少数鉴赏家能够走近他们；他们拿物理学做例子来证明这一点，广义相对论那样的理论也是只有内行人才懂。艺术家跟物理学家一样，可能并不总能让大众理解，但为了深奥而深奥却只能是愚蠢的。

尽管我们寻求的理论美由简单的基本原理赋予它的刚性，但一个理论却不单是从一组预先设定的原理就能用数学推导出来的。有些原理是在过程中产生的，有时来得很恰当，带来了我们希望的那种刚性。我一点儿也不怀疑，爱因斯坦为他的引力与惯性等价的思想感到快乐的原因之一，就是它带来了一个相当刚性的而不是无限多个可能的引力理论。从已知的物理学原理导出结果，可能很困难，也可能很容易，不过那是物理学家在研究生的时候学会的事情，他们也喜欢做。一个新物理学原理的产生却是痛苦的，显然也没有人能教。

奇怪的是，尽管物理学理论的美嵌在基本原理基础上的刚性的数学结构里，但即使我们发现基本原理错了，具有那种美的结构还可能存在。一个好例子是狄拉克的电子理论。狄拉克在1928年曾试图通过粒子波重建薛定谔形式的量子力学，使它能跟狭义相对论一致。结果，狄拉克发现电子必然有一定的自旋，宇宙充满了看不见的具有负能量的电子——空间的哪一点缺了它，我们就会在实验室看到那里出现一个带着相反电荷的电子，即电子的反粒子伙伴。自1932年在宇宙线中发现那种反电子（也就是现在我们说的正电子）以来，他的理论赢得了巨大的声誉。在30年代和40年代发展、应用并取得重大成功的量子电动力学里，狄拉克的理论是一个重要的组成部分。但我们今天知道，狄拉克的观点在很大程度上是错误的。量子力学与狭义相对论融合的适当背景，不是狄拉克所寻求的那种薛定谔形式的波动力学，而是海森伯和泡利在1929年提出的更一般形式的所谓量子场论。在量子场论里，不仅光子是场（电磁场）的一束能量；电子和正电子也同样是电子场的能量束，而其他基本粒子也是其他各种场的能量束。对于只涉及电子、正电子和（或）光子的过程，狄拉克的电子理论碰巧得出了跟量子场论相同的结果。但量子场论更加普遍——能解释狄拉克理论所不能理解的一些过程，如原子核的β衰变。^[5]在量子场论里，根本不需要粒子具有任何特别的自旋。电子确实碰巧具有狄拉克理论要求的自旋，但还有其他具有不同自旋的粒子，它们也有反粒子，却与狄拉克假想的负能量无关。^[6]尽管如此，狄拉克理论的数学却作为量子场论的基本部分保留下来，每个高等量子力学的研究生课程都必须讲它。就这样，将狄拉克引向他的理论的那个相对论波动力学的原理虽然死了，理论原来的结构却留下了。

所以，物理学家在物理学原理下发展的数学结构有着奇特的“便携性”，可以把它们从一个原理的背景带到另一个，并且满足不同的需要，像我们肩膀的灵巧骨头，在鸟儿关联着身体和翅膀，在海豚则生出鳍。我们是跟着物理学原理走向那些美丽结构的，有时原理虽然不在了，但美还在。

玻尔给了一个可能的解释。1922年，在考虑他早先的原子结构理论的未来时，他指出“只有有限的数学形式能够用于大自然，也有可能从完全错误的概念发现正确的形式。”^[7]确实，玻尔对自己理论的未来的估价是正确的；它的基本原理被放弃了，但我们还在用它的一些语言和计算方法。

纯数学在物理学的应用中，美学判断的作用确乎是非常有趣的。数学家是怀着美的愿望去建立他们的概念体系的。英国数学家哈代（G.H.Hardy）说“数学的模式像绘画和诗歌的模式那样，必须是美的。数学的思想跟绘画的色彩和诗歌的语言一样，必须以和谐的方式融合在一起。美是第一检验。丑陋的数学没有永久的位置。”^[8]不过，数学家为了美的追求而建立的结构，后来往往在物理学家那里显现出异乎寻常的价值。

为说明这一点，我们回头来看非欧几何和广义相对论。欧几里得之后的2000年里，数学家一直在努力去发现欧几里得几何的几个基本假设是否是相互独立的。如果假设不独立，其中的一个能从别的假设推导出来，那个多余的假设就该拋弃，从而产生一个更经济也更美好的几何体系。19世纪初，探索达到了高潮。那时，“数学王子”高斯（Carl Friedrich Gauss）和其他数学家为一种弯曲空间发展了一种非欧几何，^[9]能满足欧几里得的4个假设，只有第5个不能满足。^[10]这意味着第5个假设跟其他4个假设在逻辑上是独立的。这种新几何的创立是为了解决一个关于几何基础的历史遗留问题，而不是因为有谁想把它用于现实世界。

后来，非欧几何被最伟大的数学家之一的黎曼推广为一个关于二维、三维及任意维弯曲空间的理论。数学家继续做黎曼几何的研究是因为它太美了，而没想过它有什么物理学应用。它的美在很大程度上还是必然性的美。一旦你开始考虑弯曲空间，你几乎不可避免地要引进那些黎曼几何要素的数学量（如“度规”、“仿射联络”、“曲率张量”，等等）。爱因斯坦在开始建立广义相对论时发现，为了表述他的不同参照系之间的对称性，一个办法就是将引力归结为时空的曲率。他问他的朋友格罗斯曼（Mar-cel Grossman），是不是有过弯曲空间的数学理论——不仅是关于三维普通欧几里得空间里的二维曲面，还包括弯曲的三维空间，甚至弯曲的四维时空。格罗斯曼告诉了爱因斯坦一个好消息，确实有那样的数学，就是黎曼等人发展的那种几何。他教爱因斯坦学会了那个几何，爱因斯坦把它纳入了广义相对论。数学在等着爱因斯坦来用它，尽管我相信不论高斯、黎曼还是其他哪个19世纪的几何学家都不会想到他们的理论有朝一日能用于引力的物理学理论。

更奇怪的例子来自内在对称性原理的历史。在物理学中，内在对称性原理常给在菜单上的可能粒子添加一种“族结构”。最早知道的这样一个“族”是构成普通原子核的那两类粒子组成的，即质子和中子。质子和中子有非常接近的质量，所以，当查德威克（James Chadwick）在1932年发现了中子时，人们当然地假设强核力（关乎中子和质子质量的力）应该表现一种简单的对称性：假如在决定这些力的方程里处处颠倒中子和质子的地位，方程还应该保持原来的形式。这特别告诉我们，中子间的强核力和质子间的强核力是一样的，但是关于中子与质子间的力，它什么也没说。于是，当1936年的实验揭示出两个质子间的核力大概与质子和中子间的核力相同时，人们还多少感觉奇怪。^[109]这个发现生出一个新的对称性思想，那不但是质子和中子的交换的对称，也是连续变换下的一种对称，可以将质子和中子变换为两种粒子的混合状态的粒子，那个粒子以任意的概率表现为质子或中子。

这些对称变换作用在粒子的“标签”上，它们区别粒子的方法在数学上跟作用在粒子（如质子、中子或电子）自旋的普通三维旋转是一样的。^[11]因为这个例子，到20世纪60年代才有许多物理学家默默地认为保持自然定律不变的内在对称变换一定是在某个二维、三维或更多维内部空间的旋转。那时关于对称性原理在物理学应用的教科书（包括外尔（Hermann Weyl）和威格纳（Eugene Wigner）的经典著作）几乎都没有指出还有其他的数学可能。到了20世纪50年代末，当一大堆新粒子在宇宙线中被发现，然后在加速器（如伯克利的贝伐加速器^[110]）里被发现，理论物理学世界才不得不思考可能的更加广泛的内部对称性。那些粒子似乎分成比简单的质子-中子对更大的族。例如，中子和质子与其他6个叫做超子的粒子有着很近的族联系，它们有相同的自旋和相近的质量。从这样的粒子大家族能生出什么样的内在对称性呢？

1960年左右，研究这个问题的物理学家幵始在数学文献里去寻求帮助。他们惊奇而高兴地发现，原来数学家差不多把所有可能的对称性都分好类了。使任何事物（不论特殊的物体还是自然的定律）保持不变的变换的完全集合形成一个叫群的数学结构，^[12]而关于对称变换的一般数学叫群论。每个群都由抽象的数学法则来刻画，与变换的事物无关，正如算术法则不管我们加减什么东西一样。自然定律的一个特殊对称性下能有多少族，完全取决于对称群的数学结构。

那些连续作用的变换群，如普通空间的旋转或弱电理论中电子和中微子的混合，叫做李群，是以挪威数学家S·李（SophusLie）的名字命名的。法国数学家嘉当（ÉlieCartan）在他1894年的学位论文里列举了所有“单纯的”李群，通过那些变换的组合可以构造所有其他的群。^[13]1960年，盖尔曼和以色列物理学家涅曼（YuvalNe'eman）独立发现了有一种单纯李群（SU（3））恰好正确地为那一大堆基本粒子赋予了族结构，与在实验中发现的结构非常相似。盖尔曼从佛教里借来一个词，称这种对称性原理为“八正道”，^[111]因为这些熟悉的粒子都分别属于8个成员的族，如中子、质子和它们的6个伙伴构成一族。那时有些族还不完整，需要一个新粒子来填充一个10粒子的族，那些粒子有点像中子、质子和超子，但自旋是它们的3倍。SU（3）对称性的最大成功是，它预言的那个粒子1964年在布鲁克海文（Brookhaven）发现了，而且具有盖尔曼估计的质量。^[112]

群论虽然显示了与物理学那样紧密的联系，却是数学家根据数学自身的需要发展起来的。群论是伽罗瓦（Evariste Galois）在19世纪初兴起的，他当时是为了证明某些代数方程（方程中包含未知数的5次或更高次幂）没有通用的求解公式。^[14]不论伽罗瓦、李还是嘉当，都不会想到群论能在物理学中得到应用。

数学家跟着数学美的引导发展了形式的结构，物理学家多年以后发现那些结构大有作为，尽管数学家们当年并没有那样的念头。这是非常奇怪的事情。物理学家威格纳在一篇有名的文章里说这种现象是“数学的莫名其妙的功用”。^[113]物理学家总觉得数学家有着奇异的本领，能预见物理学家的理论所需要的东西。仿佛阿姆斯特朗（Neil Armstrong）1969年第一次踏上月球表面时，在尘埃里发现了凡尔纳（Jules Verne）的脚印。^[114]

那么物理学家从哪儿去获得美感——不但帮助他们发现现实世界的理论，还帮助他们判断物理学理论的有效性，有时甚至与实验证据矛盾？数学家的美感又是如何引出那些多年以后用于物理学的结构的呢——尽管数学家可能对物理学应用一点儿兴趣也没有？

我认为有三种可能的解释，两种适用于大多数科学，一种仅限于物理学的最基础领域。第一个解释是，作用于我们宇宙的仿佛是一台随机低效然而最终还是有效的教学机器。在经历无限系列的偶然事件以后，碳、氮、氧和氢等原子才结合在一起形成原始的生命形式，然后演化为原生动物、鱼和人类。我们认识宇宙的方式也是这样通过思想的自然选择逐渐演化而来的。经过数不清的错误起点，我们习惯了自然是一定的模式，我们逐渐学会了把自然的那种模式看做是美的。

我想任何人都可能这样解释为什么驯马人能凭他的美感去判断哪匹马会赢。驯马人相马多年，经历过许多胜利和失败，逐渐发现可能获胜的马具有某些看得见的特征，虽然不能具体说出来。

科学史显现无穷魅力的事情之一是去追随我们人类逐渐形成的关于自然的美。我曾经回顾20世纪30年代关于核物理内在对称性（我前面讲过的那种质子和中子间的对称性）原理的最早文献，想找一篇第一次以今天应有的形式提出那个对称性原理的文章——把那原理作为核物理学的一个自立的基本事实，而不依赖于任何核力的理论。我没有找到那样的文章。在30年代，拿对称性原理来写文章似乎不是好办法，好办法是去写核力的文章。假如力表现出一定的对称性，当然更好；那样的话，如果知道了质子与中子间的力，就不需要猜想质子与质子间的力了。但是，就我所知，对称性原理本身并没被看做能够规范一个理论——让理论变得更美的一个特征。那时候，对称性原理不过是数学技巧，物理学家真正要做的是去发现我们看到的力的动力学。

我们今天的感觉就不一样了。假如实验家发现了某些形成像质子-中子对那样的粒子族的新粒子，信箱里会很快装满数百篇文章，从理论上猜想那个粒子族背后的基本对称性。如果发现了新力，我们都会去想象决定力的存在的对称性。显然，宇宙像一台教学机器那样改变了我们，为我们培养了人类生来所不具备的美感。

数学家也生在这个宇宙，聆听它的教诲。欧几里得几何已经向中小学生教过2000多年了，是近乎完美的抽象演绎推理的范例。但是20世纪的我们从广义相对论知道，欧几里得几何表现那么好，只是因为地球表面的引力场太微弱，我们生存的空间没有产生引人瞩目的曲率。欧几里得在构造他的假设时，实际上做着物理学家的事情，凭他在希腊化时代的亚历山大港弱引力场中的生活经验来构造他的无弯曲空间的理论。他不知道他的几何局限有多大，生命有多长。实际上，很久以后我们才学会在纯数学和它应用的科学间做出区分。牛顿和狄拉克担任过的剑桥大学卢卡西（Lucasian）讲席从来是（现在也是）为数学而不是物理学的教授设立的。^[115]直到19世纪初柯西（Augustin-LouisCauchy）等人建立起严格和抽象的数学风格以后，^[116]数学家才想到他们的工作应该从经验和常识中独立出来。

我们希望成功的科学理论应该是美的，另一个原因不过是科学家喜欢选择那些可能具有美妙的解的问题。对我们驯马的朋友来说，大概也是这样。他为了赢得赛马而驯马；他学会识别哪些马可能会赢，他说那样的马是美的；不过他可能也承认，他从事驯马首先是因为他训练的马是非常美丽的动物。

物理学中的恰当例子是光滑相变现象，例如，在加热到770℃的所谓居里点以上的温度时，永磁体的磁性会自然消失。因为这是一种光滑相变，磁铁的磁化随温度接近居里点而逐渐趋于零。奇怪的是磁性在这种相变中减小到零的方式。根据对磁体不同能量的估计，物理学家猜想，如果温度恰好在居里点之下，磁化应该正比于那个温度与居里点之差的平方根。然而，实验发现磁化正比于温度差的0.37次方。就是说，磁化与温度差的依赖关系在平方根（0.5次方）与立方根（0.33次方）之间。

0.37那样的次方数叫临界指数，有时形容为“非经典的”或“反常的”，因为那不是人们所预料的。在这样那样的相变中还发现其他一些量表现出相似的行为，有时也具有相同的临界指数。这不是像黑洞和宇宙膨胀那样具有内在魅力的现象。不过，一些最具眼光的理论物理学家还是一直在研究临界指数问题，1972年，康乃尔的威尔逊（Kenneth Wilson）和费歇尔（Michael Hsher）终于把它解决了。然而还有人认为居里点的准确计算可能更具实际意义。凝聚态物理学的大师们为什么那么看重临界指数的问题呢？

我想，临界指数问题吸引那么多人的关注是因为物理学家断定它能引出美妙的解。他们感觉解是美的，首要的根据是现象的普遍性——同样的临界指数会在许多迥然不同的问题中出现，而且物理学家已经习惯地发现，物理现象最基本的性质往往是通过幂关系的定律表达的，一些量是另一些量的幂，如引力的平方反比定律。后来果然发现，临界指数理论因为它的简单性和必然性而成为所有物理学中最美的理论之一。相反，精确计算相变温度的问题却是杂乱的，涉及磁铁或其他相变物质的复杂细节，所以做这种研究要么是因为实际需要，要么是没有别的更好的事情做。

有时候，科学家对美的理论的初衷看来是错爱了。遗传编码就是一个好例子。克里克在自传里回忆，^[117]在他和沃森发现DNA双螺旋结构很久以后，分子生物学家才开始来关心解密码，细胞通过这些密码来识别DNA双螺旋上的化学单元序列，根据它来制造恰当的蛋白质分子。我们知道，蛋白质是由氨基酸链组成的，对几乎所有的动植物来说，只有20种氨基酸是重要的；任意3个相邻的化学单元对携带着在蛋白质上选择相应氨基酸的信息，那样的单元对叫碱基，只有4种。于是，遗传密码通过从4种可能的碱基选出的任意3对（就像从1副只有4种花色而无大小的牌里依次选出3张）来决定从20种氨基酸中选择1种来加在蛋白质上。分子生物学家想出了所有可能决定密码的精巧原理——例如，任意3个碱基对携带的信息都不会是多余的，不需要用来确定氨基酸的信息可以用来指示错误，就像计算机之间发送的多余字节可以检验传输的精度。20世纪60年代初发现的结果却迥然不同。遗传密码混乱极了，有些氨基酸需要的碱基对远不止3个，而有的三碱基对没有任何意义。^[118]遗传密码不像随机代码那样糟糕，这似乎说明它经过了某种演进，不过任何通讯工程师都能设计出比它更好的密码。原因当然是遗传密码不是设计的；它的进化从地球生命的开始经历了一系列偶然的事件，后来的一切生命都多少继承了它的形式。当然，遗传密码对我们来说太重要了，不论美丑我们都需要研究它，不过结果有点儿令人失望，它似乎不是很美。

有时我们的美感也让人失望，那是因为我们过高估计了我们要解释的东西的基本特征。一个著名的例子是年轻的开普勒关于行星轨道大小的工作。

开普勒知道古希腊数学里的一个美妙结果，与我们说的柏拉图固体有关。那是些三维的以平面为边界的物体，每个顶点、每根线、每个面都跟别的点、线、面相同。最简单的例子是正方体。希腊人发现，一共只有5种柏拉图固体：正方体、三角形金字塔（正四面体）、正十二面体、正八面体、正二十面体。（它们被称做柏拉图固体是因为柏拉图在《蒂迈欧篇》里提出把它们与5种基本元素一一对应起来，亚里士多德后来批判了这种观点。^[119]）柏拉图固体提供了数学美的一个朴素例子；这一点发现与嘉当关于所有可能连续对称性原理的分类有着同样的美。

开普勒在他的《宇宙的奥秘》（Mysterium Cosmographicum）里提出，只有5种柏拉图固体解释了为什么（除地球而外）只有5颗行星：水星、金星、火星、木星、土星（那时还没发现天王星、海王星和冥王星）。开普勒给每颗行星联系一个柏拉图固体，然后猜想每颗行星的轨道半径正比于对应柏拉图固体按一定次序套在一起时的半径。开普勒写道，他重新考察了行星运动的不规则性，“最后它们都满足了自然的定律”。^[120]

对今天的科学家来说，如果哪位现代科学的创立者发明那样一个空想的太阳系模型，一定会被人笑话。这不仅是因为开普勒的纲领不符合太阳系的观测结果（虽然的确不符合），更多是因为我们知道这类想象对太阳系来说是不恰当的。但开普勒也没白费，他用于太阳系的推理很像今天基本粒子物理学家的理论化方法；我们没有给柏拉图固体附会任意的东西，但我们相信可能的不同类型的力与嘉当划分的所有可能的对称性之间存在某种对应。幵普勒的错误不在于那样的猜想，而在于他（跟他以前的多数哲学家一样）把行星看得太重。

当然，行星在某些方面是很重要的。我们就生活在一颗行星上。但是不论多么基本的自然定律都不会包括行星的存在。我们现在知道，行星及其轨道是一系列偶然历史事件的结果，尽管物理学理论能告诉我们哪些轨道是稳定的，哪些是混沌的，但仍然没有理由想象在那些轨道的大小间存在什么简单优美的数学关系。

我们在研究真正的基本问题时才期待发现美丽的答案。我们相信，如果我们问世界为什么那样，然后问答案为什么那样，在解释链条的末端，我们一定会发现几个有着诱人美丽的简单原理。我们认为这部分是因为历史已经告诉我们，我们越往事物的表面下深入，越能发现更多的美。柏拉图和新柏拉图主义者教导我们，我们在自然发现的美反映了终极的精神的美。对我们来说也是这样，今天理论的美预示着终极理论的美。不管怎么说，如果理论不美，我们是不会把它当做终极理论的。

虽然我们还不能确实地知道我们工作的哪些地方需要依靠美的感觉，不过基本粒子物理学中的美学判断似乎表现得越来越好了。我想这是我们正在朝正确方向前进的明证，离我们的目标也许不会太远了。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈