物理 变分法初步(8)

§8 Sturm-Liouville方程的应用
§8.1 来自量子力学的动机
在量子力学中,物理系统的状态并不依赖于点粒子的运动,而是依赖于波函数。这些波函数实际上是复值的,但为了讨论的简化,我们可以用实函数来描述。最简单的情况是单个粒子被限制在一维有限区间$[0,1]$内。虽然点粒子可以简单地停留在这个区间内,并且具有零动能,但波函数$\psi(x)$与其导数平方的积分(即动能的一半)相关联:$\int_0^1[\psi^{\prime}(x)]^2~\mathrm{d} x$。到目前为止,这看起来有点像流体的动能,但有一个细微差别使波函数与经典流体完全不同。能量实际上是由以下比值决定的:
因此,将$\psi(x)$乘以一个常数不会产生任何影响。能量是$\psi$形状的泛函,而不是其尺度的泛函。特别地,在这个比值中$\psi \equiv 0$是没有意义的,因此没有明显的静止粒子的类比。相反,最小值的问题浮现出来,但它远非直观上明显。事实上,对于满足$\psi(0)=0=\psi(1)$的函数,答案是$\pi^2$,我们将证明这一点,而这种非零基态能量的存在是量子系统在更一般设置中典型的特征。
我们需要一个形式来处理这个问题,同时也处理当能量泛函不那么简单且空间几何不是简单区间时出现的更一般的问题。显然,在积分约束下的稳定积分理论正好提供了这种形式。上述的比值问题可以重新表述为在约束$\int_0^1{\psi(x)}^2 \mathrm{~d} x=1$下,寻找$\int_0^1[\psi^{\prime}(x)]^2 \mathrm{~d} x$最小值的问题。
因此,感兴趣的比值可以与解中的Lagrange乘数$\lambda$的值相关联。如果我们从前面的讨论来看这个问题,我们会发现$I[y]$与$J[y]$的关系在这个例子中非常简单:它只是线性的,$I=\lambda J$,$\lambda$可以解释为一个常数价格。但在这种情况下,新的点在于我们首次认真考虑到存在许多局部极值,实际上是可数的无限个,我们正在研究它们之间的相互关系。
极值之间的相互关系自然通过看到$\lambda$也作为微分算子的特征值的意义得到表达。
§8.2. Sturm-Liouville方程
我们关心的微分算子与您可能在《微分方程2》中遇到的相同,但以稍微不同的方式写出。标准的Sturm-Liouville形式为:$$\left(p(x) y^{\prime}\right)^{\prime}+q(x) y=-\lambda r(x) y \quad \text {对于 } a \leqslant x \leqslant b$$其中$p, q, r$是连续可导的,我们假设$p \geqslant 0$且$r>0$。
这是一个变分问题的Euler-Lagrange方程,该问题涉及找到$$\begin{gathered}I[y]=\int_a^b\left(p\left(y^{\prime}\right)^2-q y^2\right) \mathrm{d} x \\J[y]=\int_a^b r y^2 \mathrm{~d} x=\text {常数。}\end{gathered}$$的稳定值。
我们现在可以指出与这一解释一致的边界条件:我们在每端通常可以选择固定边界条件或自然边界条件,因此要么是$$y(a)=0 \text { 或 } p(a) y^{\prime}(a)=0$$在$b$处同样如此。
§8.3 例子
- 如果$p \equiv 1, q \equiv 0, r \equiv 1$,我们重新得到了本节开始时的例子。但现在我们可以解它:允许的$\lambda$值只是序列$\lambda_n=n^2 \pi^2$,相应的$y_n(x)$是(成比例的)$\sin (n \pi x)$。
- 如果$p(x)=1-x^2, q \equiv 0, r \equiv 1$,我们得到了区间$[-1,1]$上的Legendre方程。对于自然边界条件,解是Legendre多项式$P_n(x)$,如在《微分方程2》中遇到的。
- 如果$p(x)=x, q(x)=-k^2 / x, r(x)=x$,我们得到方程$$\left(x y^{\prime}\right)^{\prime}-\frac{k^2}{x} y=-\lambda x y$$这相当于$$y^{\prime \prime}+\frac{1}{x} y^{\prime}-\frac{k^2}{x^2} y=-\lambda y$$也可以在《微分方程2》中识别为阶数为$k$的Bessel方程。当$k>0$时,其在$x=0$处消失的解形式为$J_k(\lambda x)$。更全面的处理将引入在$x=0$处发散的Bessel方程解,但在最简单的情况下,当边界条件$y=0$在$x=0$和$x=a$处施加时,将存在一个离散的$\lambda_n$谱,使得$J_k\left(\lambda_n x\right)$在$x=0$和$x=a$处消失。
§8.4 特征函数展开
Sturm-Liouville理论的思想是推广与第一个例子自然相关的Fourier分析。您可能在《微分方程2》中遇到过Sturm-Liouville理论。《量子理论》中的时间独立Schrödinger方程在有界域内是一个Sturm-Liouville问题的特例,$p(x)$被取为常数。
从初级Fourier级数和偏微分方程,您知道如何利用它们的完备性和正交性,将一般函数展开成正弦和余弦函数。事实证明,这些属性不仅限于三角函数。
它们可以被看作是作为Sturm-Liouville常微分方程的解出现的,并且任何其他Sturm-Liouville方程都会产生具有这些完备性和正交性的新一组函数。也就是说,对于任何Sturm-Liouville方程,一般都有一个特征函数序列$y_n(x)$,具有完备性和正交性属性,这样可以有用地将一般函数展开为$\sum_n c_n y_n$,如在《微分方程2》中那样。
完整的声明和证明超出了本课程的范围(请记住,即使对于Fourier理论,完备性的问题也是微妙的,在不连续点处需要特别注意)。然而,我们可以展示如何从这种表述中直接导出重要的正交性属性。
假设对于一个$(p, q, r)$的Sturm-Liouville系统,我们有两个解$y_n, y_m$,它们对应的$\lambda_n \neq \lambda_m$。
我们首先验证,与特征函数$y_n$相关的特征值$\lambda_n$等于商$I\left[y_n\right] / J\left[y_n\right]$,因此等于积分形式中的Lagrange乘数。我们有$$\left(p(x) y_n^{\prime}\right)^{\prime}+q(x) y_n=-\lambda_n r(x) y_n$$因此乘以$y_n$并积分,$$\int_a^b\left(p(x) y_n^{\prime}\right)^{\prime} y_n+q(x) y_n^2 \mathrm{~d} x=-\lambda_n \int_a^b r(x) y_n^2 \mathrm{~d} x$$因此$$\int_a^b \frac{\mathrm{d}}{\mathrm{d} x}\left(p y_n^{\prime} y_n\right) \mathrm{d} x-\int_a^b\left(p(x) y_n^{\prime 2}-q(x) y_n^2\right) \mathrm{d} x=-\lambda_n \int_a^b r(x) y_n^2 \mathrm{~d} x$$即$$\left[p y_n^{\prime} y_n\right]_a^b-I\left[y_n\right]=-\lambda_n J\left[y_n\right]$$但由于在边界$a$处我们要么有$y_n(a)=0$,要么有$p(a) y_n^{\prime}(a)=0$,在$b$处也是如此,因此边界项消失。因此如所要的,$I\left[y_n\right]=\lambda_n J\left[y_n\right]$。
现在我们将证明$y_m, y_n$是正交的,意味着$$\int_a^b r y_n y_{m n} \mathrm{~d} x=0$$我们有
$$\begin{aligned}\left(p(x) y_n^{\prime}\right)^{\prime}+q(x) y_n & =-\lambda_n r(x) y_n \\\left(p(x) y_m^{\prime}\right)^{\prime}+q(x) y_m & =-\lambda_m r(x) y_m\end{aligned}$$
将第一个乘以$y_m$,第二个乘以$y_n$,相减并从$a$到$b$积分得出$$\int_a^b\left(y_m\left(p y_n^{\prime}\right)^{\prime}-y_n\left(p y_m^{\prime}\right)^{\prime}\right) \mathrm{d} x=-\left(\lambda_n-\lambda_m\right) \int_a^b r(x) y_m y_n \mathrm{~d} x$$左边的项可以精确积分为$$\left[p\left(y_m y_n^{\prime}-y_n y_m^{\prime}\right)\right]_a^b$$因此由于边界条件而消失。在$a$处,我们要么有$y_m(a)=0=y_n(a)$,要么有$p(a) y_m^{\prime}(a)=0=p(a) y_n^{\prime}(a)$,在$b$处也是如此。因此右边的项消失,并且由于假设$\lambda_m-\lambda_n \neq 0$,正交性成立。
这个论证与在代数课程中讨论内积的一般定义时所使用的论证相同。我们实际上通过使用$r(x)$作为权函数,在一个函数空间上定义了一个内积结构。然后我们可以通过选择适当的尺度使
$$J\left[y_n\right]=\int_a^b r(x)\left[y_n(x)\right]^2 \mathrm{~d} x=1$$
来定义相对于这个内积的正交基函数集$y_m$。
§8.5 Rayleigh-Ritz近似法
在整个课程中,我们强调了变分形式是一条双向街道。我们的理论通过微分方程的求解,解决了涉及极值的著名问题。另一方面,它可以有效地将与微分方程相关的问题重构为稳定积分。在Sturm-Liouville方程的背景下,谱特征值可以通过计算积分$I[y]$和$J[y]$来有效地研究。特别是,尝试任何满足边界条件的$y$都可以为最低特征值$\lambda_1$给出一个上界。
因此,回到原始例子
我们可以尝试最简单的满足边界条件的$y$,$y=x(1-x)$,并计算$$Q=\frac{\displaystyle\int_0^1(2 x-1)^2 \mathrm{~d} x}{\displaystyle\int_0^1 x^2(1-x)^2 \mathrm{~d} x}=10$$因此$\lambda_1 \leqslant 10$。这是一个对$\lambda_1=\pi^2$的良好近似。
这一过程可以改进。显然,通过在一组参数上优化检验$y$,可以改善这一近似。因此,我们得到对$y_1$的一个良好近似$\bar{y}_1$。然后,下一特征值可以通过在所有与$\bar{y}_1$正交的检验函数类上进行优化来估计。这给出了$\lambda_2$和$y_2$的估计,依此类推。
特征值近似好的原因在于;如果检验函数$\bar{y}_1$对$O(\epsilon)$是正确的,则特征值$\lambda_1$将对$O\left(\epsilon^2\right)$是好的。因为如果$$\bar{y}_1=y_1+\sum_{n=2}^{\infty} c_n y_n$$其中每个$c_n$都是$O(\epsilon)$,则$Q\left[y_1\right]$与$\lambda_1$的差异为$O\left(\epsilon^2\right)$,因为