物理 变分法初步(4)

§4 扩展到多变量和Hamilton原理
在本节中,我们探讨变分法在经典力学中的应用。
首先,我们需要进行适度的推广,以允许多个因变量。为此,改变我们的符号表示是很方便的,因为在力学应用中,通常时间是唯一的自变量。多个因变量代表力学系统的空间坐标。因此,我们首先考虑$q(t)$和$F(t, q, \dot{q})$,而不是$y(x)$和$F\left(x, y, y^{\prime}\right)$,其中$q$是典型的空间坐标,$t$是时间。使用$q$而不是$x$作为因变量是有原因的;我们不希望被限制在直角坐标系内,因为使用字母$x$可能会错误地暗示这一点。变量$q$可能是角度或径向距离等。然后我们推广到$q_1(t), q_2(t), \ldots, q_n(t)$和函数$F\left(t, q_1, \ldots, q_n, \dot{q}_1, \ldots, \dot{q}_n\right)$。因此,我们考虑以下泛函的稳定值$$I\left[q_1, \ldots, q_n\right]=\int_a^b F\left(t, q_1, \ldots q_n, \dot{q}_1, \ldots, \dot{q}_n\right) \mathrm{d} t\tag{37}$$
定理 4.1 设$F$为一个光滑函数,并且$$I\left[q_1, \ldots, q_n\right]:=\int_a^b F\left(t, q_1, \ldots, q_n, \dot{q}_1, \ldots, \dot{q}_n\right) \mathrm{d} t$$那么泛函$I$的极小化函数$q_1=q_1(t), \ldots, q_n=q_n(t)$满足$$\frac{\mathrm{d}}{\mathrm{d} t} \frac{\partial F}{\partial \dot{q}_i}-\frac{\partial F}{\partial q_i}=0, \text{对于 } i=1, \ldots, n\tag{38}$$以及自然边界条件$$\left[\frac{\partial F}{\partial \dot{q}_i}\right]_a^b=0, \text{对于 } i=1, \ldots, n\tag{39}$$在满足约束条件$q_i(a)=c_{1, i}$和$q_i(b)=c_{2, i}$的情况下,泛函$I$的极小化函数满足上述方程(37),但不一定满足方程(38)。
证明概要:找到这些极小化函数的方法与最简单情况下相同;我们选择一个指标$i$和一个检验函数$\eta_i$,并暂时固定$q_j$(对于$j \neq i$),但使$q_i$变化,即$q_i(t) \rightarrow q_i(t)+\alpha \eta_i(t)$。由于我们暂时固定了$j \neq i$的$q_j$,因此泛函$I$的形式正是已经考虑过的情形。Euler-Lagrange方程给出$$\frac{\mathrm{d}}{\mathrm{d} t} \frac{\partial F}{\partial \dot{q}_i}-\frac{\partial F}{\partial q_i}=0$$并且自然边界条件为$$\left[\eta_i \frac{\partial F}{\partial \dot{q}_i}\right]_a^b=0 。$$依次对每个指标$i$执行上述步骤,得出结果。$$~\tag*{$\square$}$$我们有两个重要的特殊情况:
1) 当某个变量$q_i$不出现在$F$中时,会出现“可忽略坐标”,$$\frac{\partial F}{\partial q_i}=0\text{意味着}\frac{\partial F}{\partial \dot{q}_i}\text{是一个常数。}\tag{40}$$
2) 当$F$与时间$t$无关时,会出现Beltrami恒等式的推广形式,$$\frac{\partial F}{\partial t}=0\text{意味着}H=\sum\limits_{i=1}^n \dot{q}_i \frac{\partial F}{\partial \dot{q}_i}-F\text{是一个常数。}\tag{41}$$
§4.1. Hamilton原理
以下陈述总结了为什么经典力学可以通过极值问题重构,并通过变分法求解。
定义 1. 如果在力学系统中没有摩擦,约束不做功,则称该约束为无功约束(workless constraint)。
如果一个约束的形式为$\phi\left(q_i, t\right)=0$,其中$q_i$为一组坐标,且该约束不涉及速度$\dot{q}_i$,则称该约束为完整约束(holonomic constraint)。
如果一个力是某个势函数$V$的梯度,则称该力为保守力(conservative force)。
原理(Hamilton原理)。如果一个力学系统仅受完整的无功约束且所有力都是保守力,则根据Newton定律,系统的运动是积分
$$I[q]=\int L\left(q_i, \dot{q}_i, t\right) \mathrm{d} t\tag{42}$$
的极值,其中坐标$q_i$是任意但不受约束的,$L=T-V$,即系统的动能减去势能在这些坐标中的表达。$L$被称为Lagrange量。
这就是Hamilton原理,也称为最小作用量原理(principle of least action),其中积分$I[q]$称为作用量(action)。
在本文中,我们将其视为已知而不加以证明,即它正确使用了物理定律。(在经典力学课程中将证明它与Newton定律是等价的。)注意,$I[q]$的量纲是能量乘以时间。作用量是具有这些量纲的物理量的一个术语。事实证明,它是最基本的物理量(特别是Planck常数是作用量的一个量子)。
例 9(无任何外力作用下的自由空间中的运动) 最简单的例子是取$L=T=\frac{1}{2} m\left(\dot{x}^2+\dot{y}^2+\dot{z}^2\right)$。Euler-Lagrange方程为$$\ddot{x}=\ddot{y}=\ddot{z}=0,\tag{43}$$即自由粒子的Newton运动定律。
例 10(受保守力作用的自由空间中的运动) 下一个最简单的例子是$L=T-V=\frac{1}{2} m\left(\dot{x}^2+\dot{y}^2+\dot{z}^2\right)-m \psi(x, y, z)$,描述在仅受具有势$\psi$的保守力(通常是Newton引力)作用下的自由空间中的运动。此时,Euler-Lagrange方程变为$$\ddot{x}=-\frac{\partial \psi}{\partial x}, \quad \ddot{y}=-\frac{\partial \psi}{\partial y}, \quad \ddot{z}=-\frac{\partial \psi}{\partial z}。$$如果我们进行坐标变换,作为稳定积分的重构价值通常会更加明显。对于轨道问题,当$\psi=-k / r$时,使用Cartesian坐标$x, y, z$虽然有效,但并不十分有用。由于Lagrange量形式不在意我们使用哪种坐标,因此更方便使用球极坐标。
例 11(势$\psi=-k/r$的轨道问题) 在极坐标$(r, \phi, \theta)$中,对于具有势$\psi=-k / r$的自由空间运动,我们有$$L=T-V=\frac{1}{2} m\left(\dot{r}^2+r^2 \dot{\theta}^2+r^2 \sin ^2 \theta \dot{\phi}^2\right)+\frac{k m}{r} 。$$$\theta$方程为:$$\frac{\mathrm{d}}{\mathrm{d} t}\left(r^2 \dot{\theta}\right)-r^2 \sin \theta \cos \theta \dot{\phi}^2=0$$其解为$\theta \equiv \pi / 2$,即路径始终在赤道平面上。将注意力限制在这种路径上,剩下的方程变为$$\begin{gathered}\ddot{r}-r \dot{\phi}^2+\frac{k}{r^2}=0 \\frac{\mathrm{d}}{\mathrm{d} t}\left(r^2 \dot{\phi}\right)=0\end{gathered}$$在初步动力学中,通过更长的论证得出了相同的方程。显然,$\phi$方程可以积分为$$r^2 \dot{\phi}=h$$非常重要的是要注意,这一步的简洁性直接来源于$\phi$从未出现在$L$中;它是一个可忽略坐标。角动量守恒是这种Lagrange量形式中使用Hamilton原理的可忽略坐标的直接结果。
能量守恒定律同样可以很容易地推导出来;它相当于Beltrami恒等式。根据上述观点,$L$对$t$没有显式依赖意味着$$H=\sum_{i=1}^n \dot{q}_i \frac{\partial L}{\partial \dot{q}_i}-L\tag{44}$$沿着路径保持不变。
从$L$的原始形式(在专注于赤道路径之前)可以立即看出,在这种情况下$H$就是$T+V$,即总能量。对于赤道路径,我们简化为$$\frac{1}{2}\left(\dot{r}^2+r^2 \dot{\phi}^2\right)-\frac{k}{r}=E\tag{45}$$因此,现在我们将整个问题简化为单一积分,得出了众所周知的圆锥曲线解。
我们使用的两个简化定理——可忽略坐标和Beltrami恒等式——指出了物理理论的一个深刻特征。对称性概念(即在一组变换下的不变性)与守恒定律之间存在直接联系。
角度$\phi$的独立性意味着作用量在$\phi \rightarrow \phi+\alpha$下保持不变,这一事实等价于角动量的守恒。在一个$x$是可忽略的情况下,即作用量在$x \rightarrow x+\alpha$下保持不变,对应的$x$方向的动量是守恒的。而当$t$可以被替换为$t+\alpha$时,我们有能量守恒。
注意到角度$\times$角动量、长度$\times$动量和时间$\times$能量,这些都具有作用量的量纲。这种共轭关系在量子力学中变得至关重要,并且是著名的Heisenberg不确定性原理的基础。
Euler-Lagrange方程在坐标变化下必须保持相同的形式,因为稳定性的概念不依赖于使用哪个坐标系来描述问题。从技术层面上讲,这意味着我们可以使用任何我们喜欢的坐标来写出$T$和$V$,而无需进行任何链式规则的变量变换。
我们将通过几个例子来说明这种简洁性。