Brethland's Blog

JK 也能听懂的理论物理(三)

07-12-2020

这是该系列的第三篇,主要讲对称性和不变量,对微分几何有一定了解可以更好理解内容,但不是必需。本文要求一定的线性代数基础。前一篇的链接为JK 也能听懂的理论物理(二)

STrick

对称群

没有运动的物理学一定是不完整的物理学,为了能阐述运动,我们需要独立于特殊对象,建立起一门关于变换和对称的科学。数学再一次帮助了我们:群,是一个天然适合表述变换的代数结构。从具体的例子说,设想有一种二维旋转变换,定义向左为 \(L(x)\),向右为 \(R(x)\),先后旋转的组合运算为 \(L(x) \circ R(x)\),很容易验证有以下性质:

  1. 封闭:对任意旋转 \(g_1, g_2 \in G\), \(g_1 \circ g_2 \in G\)
  2. 单位元:存在 \(e \in G\),使得 \(\forall g \in G, g \circ e = e \circ g = g\)
  3. 逆元:\(\forall g \in G, \exists g^{-1} \in G, g \circ g^{-1} = g^{-1} \circ g = e\)
  4. 结合律:\(\forall g_1, g_2, g_3 \in G, g_1 \circ (g_2 \circ g_3) = (g_1 \circ g_2) \circ g_3\)

将这个旋转变换群作用在单位圆上,就会发现经过任意变换后,圆保持不变,这时我们把这个群称为对称群,这是个十分重要的概念,回想一下洛伦兹变换满足的矩阵式,事实上,洛伦兹变换对四维的闵可夫斯基度规确实构成了一个对称群。

以上对旋转的定义是模糊的,用更精确的矩阵表示这个群,有:

\[R(\theta) = \begin{pmatrix} cos\theta & -sin\theta \\ sin\theta & cos\theta \end{pmatrix}\]

这个定义被称为 \(SO(2)\) 群,它不够直观,我们需要一个更本质的定义。验证发现,所有模为1的复数,加上乘法构成了一个群,这被称为 \(\mathcal{U}(1)\) 群,将上式改写为:

\[R(\theta) = cos\theta + isin\theta = cos\theta \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} + sin\theta \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}\]

它对 \(\mathcal{U}(1)\) 群里的所有元素作用是和 \(SO(2)\) 等效的,可以说,两个群是同构的。

扩展到三维,情况就复杂多了,我们可以看到,绕每一个轴都有与二维类似的旋转矩阵,它们构成的 \(SO(3)\) 冗长,复杂又不够优美,继续我们刚刚的改写,这次用四元数代替复数:

\[q = cos\theta + usin\theta,\ u = ai + bj + ck,\ det(q) = 1,\\ i = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}, j = \begin{pmatrix} 0 & i \\ i & 0 \end{pmatrix}, k = \begin{pmatrix} i & 0 \\ 0 & -i \end{pmatrix}\]

这下好看多了,要保证度规不变,我们定义 \(v = xi + yj + zk\),使得 \(v' = qvq^{-1}\)。这样,一个 \(S\mathcal{U}(2)\) 群就诞生了,神奇的事情发生了,我们来带入一个例子:\(x\) 轴单位向量绕 \(z\) 轴旋转:

\[v' = R_z(\theta)vR_z(\theta)^{-1} \\ = \begin{pmatrix} cos\theta + isin\theta & 0 \\ 0 & cos\theta - isin\theta \end{pmatrix} \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix} \begin{pmatrix} cos\theta - isin\theta & 0 \\ 0 & cos\theta + isin\theta \end{pmatrix} \\ = \begin{pmatrix} 0 & e^{i2\theta} \\ -e^{-2i\theta} & 0 \end{pmatrix}\]

多出来的倍数2是怎么回事呢?这说明对于一个 \(SO(3)\) 的元素,有两个 \(S\mathcal{U}(2)\) 元素与它对应,这时我们说 \(S\mathcal{U}(2)\) 覆盖(double-cover)了 \(SO(3)\)。当一个对称群覆盖了另一个时,我们在之后可以看到,它是更为本质的。

对于有限的变换,我们使用最基本的矩阵表示已经足够,但如果涉及到连续的,无穷的变换——物理学大多是这样的,我们就需要一种新形式:李群(Lie Group)。运用微积分里对连续量的思考,我们相似地定义一个无限小量:

\[g(\epsilon) = I + \epsilon X\]

其中 \(I\) 是单位元,由此,任意变换都可以认为是无限小量的无限叠加:

\[h(\theta) = \lim_{N\to\infty}(I + \frac{\theta}{N}X)^{N} = e^{\theta X}\]

所有的群元素都由确定的生成元(Generator) \(X\) 构成,因此对于一个李群,只需要确定其生成元和生成元的组合方式(我们一般称其为交换算子)。这两样共同组成的代数结构,就是李代数(Lie Algebra)。满足条件的 \(S\mathcal{U}(2)\) 李群的生成元组被称为泡利矩阵(Pauli Matrices),它们是:

\[\delta_1 = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix},\ \delta_2 = \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix},\ \delta_3 = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix}\]

其他所有生成元可以被认为是它们的线性组合。

读者读到这里肯定已经猜出来了,模为 1 的复数在几何上表示是单位圆,模为 1 的四元数——同样的,也是一个四维的球 \(S^3\)!有一个优美的定理:每一个李代数,都只有一个简单连通的李群(流形)与之对应。如此,我们也可以把 \(SO(3)\) 看作是 \(S\mathcal{U}(2)\) 的上半部分。

庞加莱群

我们最后要做的工作是,将抽象的对称群,利用表示论的知识重新转换到向量空间上。不言而喻,从抽象群到向量空间 \(V\) 的转换必须符合群公理,在这一基础上,一个非平凡的表示还必须不可约,即该表示保证了不存在一个封闭的 \(V\) 的子空间。由是利用舒尔引理:

对一个不可约表示 \(R\),每一个与所有生成元满足交换律的线性算子 \(T\) 都是标量。

我们找到了 \(S\mathcal{U}(2)\) 的线性算子 \(J^2 = J_1^2 + J_2^2 + J_3^2 = 2\),其中只有 \(J_3\) 是对角化的:

\[J_3 = \begin{pmatrix} 1 & 0 & 0 \\\ 0 & 0 & 0 \\ 0 & 0 & -1 \end{pmatrix}\]

将它们改写成特征值表示:

\[J^2 = b(b, m) \\ J_3 = m(b, m)\]

定义两个操作符:

\[J_\pm = J_1 \pm iJ_2\]

有趣的是,对任意的 \(J_3\) 进行这两个操作符的运算,都会得到新的不同维度的 \(J_3\),因此它们也被称为梯子操作符,根据 \(S\mathcal{U}(2)\) 群原本的条件列出方程,我们可以看到这些特征值的取值是离散的。

我们知道,所有使得闵可夫斯基度规不发生改变的变换被称为洛伦兹变换,根据行列式和第一个元素的正负,它们可以被分为四类。用逆时矩阵 \(\Lambda_T\) 和逆空间矩阵 \(\Lambda_P\),我们将洛伦兹群归为第一种的不同变换(读者可以自行思考这两个矩阵的表示):

\[O(1, 3) = \{L_+^{\uparrow}, \Lambda_P L_+^{\uparrow}. \Lambda_T L_+^{\uparrow}, \Lambda_P \Lambda_T L_+^{\uparrow}\}\]

以上知识已经足够我们得出洛伦兹群的李代数,篇幅限制,我们直接给出结果:容易验证旋转变换 \(S\mathcal{U}(2)\) 是满足洛伦兹变换的条件的,另一加速变换(Boost)则通过闵可夫斯基度规的要求 \(\Lambda^T \eta \Lambda = \eta\) 得出,这两个变换并不满足生成元的交换条件,因此将它们合并为:

\[N^\pm_i = \frac{1}{2}(J_i \pm iK_i)\]

加速变换 \(K_i\) 和旋转变换 \(J_i\) 之间的交换关系与旋转变换本身是一样的,所以洛伦兹群也覆盖了 \(S\mathcal{U}(2)\) 群。对 \(N^+\) 和 \(N^-\) 分别赋值泡利矩阵(还记得它是 \(S\mathcal{U}(2)\) 的生成元吗),我们得到了三种表示:

  1. \((0 ,0)\) 表示,即零自旋表示,用来描述标量粒子,如希格斯玻色子。
  2. \((\frac{1}{2}, 0) \oplus (0, \frac{1}{2})\) 表示,用来描述旋量粒子,如电子和夸克。
  3. \((\frac{1}{2}, \frac{1}{2})\) 表示,用于描述向量粒子,如光子。

从变换的对称性,我们窥见了自然精妙的设计,自旋这一基本量的不同,确确实实地描述了所有基本粒子。

最后,给洛伦兹群加上坐标尺度的平移变换(Translation),我们得到了庞加莱群,这已经足够描述光速不变原理下的所有物理定律。

不变量

平者,水停之盛也,其可以为法也。
—— 《庄子·内篇》

在本系列的第一篇里,我们介绍了一种改进经典力学的新形式:拉格朗日力学,并提出了作用量的概念。如果我们把这个想法更进一步,考察作用量在变换中的性质,会发现很多有趣的结论。

我们认为在经典力学里,作用量关于时间的微分为拉格朗日量 \(\mathcal{L}\),并介绍了它对于速度的微分:广义动量。这是个比较粗暴的讲述,为什么它被称为动量呢?

中学里对动量的定义是 \(p = mv\),容易看出这就是动能对速度的导数。对于凸函数 \(T = \frac{mv^2}{2}\),它有以下这个性质:

给定直线族 \(y=px\),函数 \(F(p,x) = y - f(x)\) 在 \(x=x(p)\) 时会取得 \(x\) 的极值。则 \(T^*(p) = sup\{F(p,x)\}\) 被称为 \(T\) 的勒让德(Legendre)变换,这也是原函数的对偶函数(即它们的一阶导数互为反函数)。

对动能,我们有 \(T^*(p) = max\{pv - \frac{mv^2}{2}\}\),\(F(p,v)\) 的极值条件:

\[\frac{\partial F}{\partial v} = p - mv = 0\]

故该斜率即为动量,带入得对偶函数为:

\[T^*(p) = \frac{p^2}{2m}\]

如果有闲心对该函数再求一次勒让德变换,可以发现回到了动能式。这个表现的深刻之处在于,它将坐标空间上的对速度的累计动能,成功和相空间上的对动量的累计动能对应了起来(微分几何上则是切丛和余切丛的关系,在此不作过多表述)。

要考察其在时间变换下的表现,我们对拉格朗日量 \(\mathcal{L}(q, \dot q, t)\) 取时间的全微分(乘上虚数单位):

\[\frac{d\mathcal{L}}{dt} = \frac{\partial \mathcal{L}}{\partial q_i}\dot{q^i} + \frac{\partial \mathcal{L}}{\partial \dot{q_i}}\ddot{q^i}\]

带入欧拉-拉格朗日方程有:

\[\frac{d\mathcal{L}}{dt} = \frac{d}{dt}(\frac{\partial \mathcal{L}}{\partial \dot{q_i}}\dot{q^i})\]

我们很容易看到用动量记号 \(p^i = \frac{\partial \mathcal{L}}{\partial \dot{q_i}}\) 代换后重定义,原来的拉格朗日量就会转化成汉密尔顿量 \(\mathcal{H} = F(p) = p\dot{q} - \mathcal{L}\)。它更适合来研究时间变换尺度下的不变性。

要证明作用量在时间变换下的不变,即证明与拉格朗日量对偶的汉密尔顿量,是一个与时间无关的函数,即得出了能量守恒。到了量子力学里,粒子在场中运动的汉密尔顿方程(E-L 方程的改写),则是著名的薛定谔方程。

由此推广地看,不光光是时间变换,平移、旋转和其他变换都能得到一个自然界固有的不变量,而这也就是下一节所要讲述的核心。

诺特定理

诺特定理本质上是个微分几何领域的定理,但从前几节我们已经或多或少感受出了运动系统和几何流形之间的关系。伟大的发现往往把看似矛盾的事物联系在了一起,这条理论物理的中心结论之一就是这样,它从连续的对称中发现了一种守恒的关系。

证明这个定理的方法有许多种,但第一步是要形式化它。如果只是说“任意变换对称性都有一个对应的守恒量”,是不准确的。我们说这句话省略了很多的前提。

延续上一节的框架,我们定义在拉格朗日量 \(\mathcal{L}(q, t)\) 下,系统的微分增长为 \(\mathcal{L}(q + \delta_q, t + \delta_t)\),我们认为系统作用量此时具有对称性,当且仅当 \(\delta_S = S(q') - S(q) = 0\)。当我们将微分增长用无穷小量表示:

\[q' = q + \delta_q = q + \epsilon \Delta q \\ t' = t + \delta_t = t + \epsilon \Delta t\]

当且仅当 \(\epsilon\) 为一趋近于 0 的常量时成立,这时我们称这系统具有连续的全局对称性。同时,在这个范畴下我们需要一个确定的运动方程(比如 E-L 方程)来完成对称性和守恒量之间的对应,也即该守恒量是在壳(on shell)的。

如此诺特定理的准确表述是:一个离壳的连续全局对称性具有一个在壳的守恒量 \(I = p\Delta q - \mathcal{L}\) 与之对应。

回到第一节介绍的李代数,我有意略去了交换算子的介绍,在这里,我们将详细地说明。一个交换算子(李括号)是一种运算,它满足下列三条规则:

  1. 双线性:\([X, aY + bZ] = a[X, Y] + b[X, Z]\)
  2. 反对称:\([X, Y] = -[Y, X]\)
  3. 雅可比恒等性:\([X, [Y, Z]] + [Z, [X, Y]] + [Y, [Z, X]] = 0\)

在李代数对应的李群 \(G\) 上定义一组映射 \(F_t^a : G \to G\),使得它遵守 \(\frac{d}{dt} F_t^a(b) = [a, F_t^a(b)]\)。显然这组映射就是作用在 \(G\) 上的变换。我们可以验证它很好地满足了群公理。

对于变换满足的条件 \(F_t^a(b) = b\),我们说 \(a\) 产生了连续的全局对称性,同时,\(b\) 也自然是一个守恒量,现在我们要证明, \(b\) 对该系统也具有连续的全局对称性,即 \(F_t^b(a) = a\)。

对等式取微分即:

\[\frac{d}{dt}F_t^a(b) = [a, F_t^a(b)] = 0\]

在不变换的情况下,即使 \(t = 0\) 得:

\[[a, F_0^a(b)] = [a, b] = -[b, a] = 0\]

即 \(F_t^b(a) = a\) 证毕。诺特定理成立。

下一篇中,我们将说说如何从量子场论的角度,讨论对称性是如何描述标准模型的,同时,又有哪些不变量可以被实验证实。当然,物理学远远没有达到尽头,由此延伸出的更多问题,我也会做出评论,敬请期待。

附:艾米·诺特的生平

Her courage, her frankness, her unconcern about her own fate, her conciliatory spirit were, in the midst of all the hatred and meanness, despair and sorrow surrounding us, a moral solac.
— Hermann Weyl

艾米·诺特(Emmy Noether)出生于巴伐利亚州一个普通的中产犹太家庭。1900年,18岁的诺特从一所中学毕业,并获得教师资格,在当时,富有的中产小姐在中学教授英语和法语被认为是一项体面的工作,但诺特却放弃了这个机会,她决定就读埃尔朗根大学。

诺特一开始被允许旁听数学系的课程,1904年正式成为学生。在哥尔丹的指导下,她花费三年时间获得了博士学位,研究方向是代数不变量。她计算出了三百多个不变量,并在数学界获得了良好的反响,尽管在之后,她并不满意自己的成果,认为它们是毫无意义的。

诺特随后在母校无偿教授了七年的数学。1915年,受希尔伯特的邀请来到哥廷根。按照普鲁士法律,女性并不能获得教职,面对诸多质疑,希尔伯特做出了著名的回击:“我们毕竟是一所大学,而不是一间澡堂。”在这段时间里,诺特证明了关于守恒量的定理,并由克莱因代为在皇家科学院发表。

1918年,看到诺特研究的爱因斯坦写信给克莱因:“在阅读了诺特小姐的研究后,我再次为她没有教职而感到不公。”在希尔伯特的名义下开设讲座四年后,诺特终于获得了一个依然无薪的教职,可以自己教授学生。一战以后的飞速通货膨胀让她的生活十分艰难,但她并不在乎这点。

诺特在随后的十三年中对纯粹数学做出了巨大贡献,她对环的理想做出了准确定义,并在1928年看到了交换代数和拓扑学之间深刻的联系,因此被认为是代数拓扑的奠基人之一。她喜欢在授课时与学生讨论,许多重要发现也是因此做出的。

1933年,诺特由于犹太人身份被哥廷根解雇,在她曾经门生韦伯的鼓吹下,学生们开始向校内“反德意志精神”势力发起攻击,哥廷根大学的数学中心地位自此失去,希尔伯特在面对纳粹教育委员会提问时回答:“哥廷根的数学?再也没有了。”

诺特在美国一所女子学院度过了生命中最后两年,1935年,她在治疗卵巢囊肿的术后感染中去世。她被认为是二十世纪最为重要的数学家之一。如同许多同时代的女性一样,她用天赋、热情和创造力向我们证明了,真理永远独立于身份之外。

参考资料

  1. J. Schwichtenberg, Physics from Symmetry(2nd Edition), Springer, 2018.
  2. J. Baez, Getting to the Bottom of Noether’s Theorem, 2018.
  3. D. Stretch, Emmy Noether: Against the odds, 2000.
  4. Many entries on Wikipedia.