变分学1

本节仅仅讲述变分学的来源和对于泛函极值求解的$E-L$方程和$L-H$条件,并且针对泛函极值的必要性和充分性做出探讨。

变分学引论

变分学是研究泛函极值(更一般地是临界值)的一个数学分支。

目前我们关注的变分学是从一个函数集合到一个实数域$\mathbb{R}$上的映射。定义域$M$为一个函数集合,也就是$I:M{\to}\mathbb{R}$

一般形式

给定一个函数$L{\in}C^1(\overline{\Omega}{\times}R^{N}{\times}R^{nN})$,变分学主要研究如下形式的泛函:

$$ I(u)=\int_{\Omega}L(x,u(x),\nabla{u(x)})dx $$

其中$M$是连续可微函数类$C^1(\overline{\Omega})$的子集合,或者是某种广义可微函数类的子集合,它由一些限制条件如(积分形式的、逐点的、带微分的、不带微分的)边值条件和约束条件等所规定。

典型例子

最速下降线

在垂直平面上给定两点$A=(x_1,y_1)$和$B=(x_2,y_2)$,其中$x_1<x_2,y_1>y_2$。一个质点沿着一条连接这两点的光滑曲线仅借重力下滑,设初速度为零,问沿怎样的一条曲线滑行时间最短?

解:设$u{\in}C^1[x_1,x_2],\left\{(x,u(x))|x{\in}[x_1,x_2],u(x_i)=y_i,i=1,2\right\}$是连接$A,B$的一条曲线,因为有

$$ \begin{cases} \frac{1}{2}mv^2=mgh,\\ v=\frac{ds}{dt} \end{cases} $$

所以有

$$ v=\sqrt{2g(y_1-u(x))} $$

以及

$$ dt=\frac{ds}{v}=\sqrt{\frac{1+|u'(x)|^2}{2g(y_1-u(x))}}dx $$

总时间

$$ T=\int^{x_1}_{x_0}dt=\frac{1}{\sqrt{2g}}\int^{x_1}_{x_0}\sqrt{\frac{1+|u'(x)|^2}{(y_1-u(x))}}dx $$

$$ M=\left\{u{\in}C^1([x_1,x_2])|u(x_i)=y_i,i=1,2\right\} $$

则映射

$$ M{\to}\mathbb{R},u{\mapsto}T $$

是一个泛函,这里的$u$是自变量,$T=T(u)$是因变量,我们要在$M$中求$u$以使得$T$达到最小。

测地线

在单位球面$S^2=\left\{(x_1,x_2,x_3){\in}R^3|\sum^3_{i=1}x^2_{i}=1\right\}$上给定两点$P_0=(x_1^0,x_2^0,x_3^0),P_1=(x_1^1,x^1_2,x_3^1)$,求连接这两点的弧长最短的曲线。

解:我们采用球面坐标$v=(\theta,\varphi){\in}[-\frac{1}{2}\pi,\frac{1}{2}\pi]{\times}[0,2\pi)$,则

$$ \begin{cases} x_1=x_1(v)=cos{\theta}cos{\varphi}\\ x_2=x_2(v)=cos{\theta}sin{\varphi}\\ x_3=x_3(v)=sin{\theta}\\ \end{cases} $$

确定出$v^i=(\theta^i,\varphi^i)$,满足$P_i=(x_1(v^i),x_2(v^i),x_3(v^i)),i=0,1$

$$ M=\left\{v{\in}C^1([0,1],[-\frac{1}{2}\pi,\frac{1}{2}\pi]{\times}[0,2\pi))|v(i)=v^i,i=0,1\right\} $$

则$\forall v{\in}M,u(t)=(x_1(v(t)),x_2(v(t)),x_3(v(t)))(t{\in}[0,1])$是连接$P_0,P_1$两点的连线。

这曲线弧元的平方是

$$ ds^2=dx_1^2+dx_2^2+dx_3^2=d{\theta}^2+cos^2{\theta}d{\varphi^2}=({\theta'}(t)^2+cos^2{\theta(t)}{\varphi'(t)}^2)dt^2 $$

故弧长$L:M{\to}\mathbb{R}$为

$$ L(v)=\int^1_0|ds|=\int^1_0{\sqrt{({\theta'}(t)^2+cos^2{\theta(t)}{\varphi'(t)}^2)}}dt $$

极小曲面

在空间$\mathbb{R}^3$中给定一条Jordan曲线$\Gamma$,能否找到一个盘状的曲面$S$张在$\Gamma$上使其面积达到极小值?用参数方程描写$S:(u,v){\mapsto}Z=(x,y,z):\overline{D}{\to}\mathbb{R}^3$,其中$D{\subset}\mathbb{R}^2$是单位圆,$u^2+v^2{\le}1$,

$$ \begin{cases} x=x(u,v)\\ y=y(u,v)\\ z=z(u,v) \end{cases} $$

这曲面的面积是

$$ \begin{align*} A(Z)&=\int_D|Z_u{\times}Z_v|dudv\\ &=\int_D\sqrt{(x_uy_v-y_ux_v)^2+(y_uz_v-z_uy_v)^2+(z_ux_v-x_uz_v)^2}dudv \end{align*} $$

面积$A$是曲面函数$Z$的泛函。我们要在$Z|_{\partial{D}}$与$\Gamma$同胚的条件下求$A$的极小值,即取

$$ M=\left\{Z{\in}C^1(\overline{D},\mathbb{R}^3)|Z|_{\partial{D}}{\simeq}{\Gamma}\right\} $$

求向量函数$Z(u,v)=(x(u,v),y(u,v),z(u,v)){\in}M$,使得$A(Z)$达到极小值。

这里提及一下变分原理:物理上的问题基本遵循变分原理:从经典力学到规范场论,物质运动的规律遵循变分原理。

狭隘一点的可以看到数学物理方程组变分原理:讲述了变分问题的解就是泊松方程边值问题的解。变分原理提供了亚久偏微分方程边值问题的一个新观点和途径,研究积分在哪种函数类中确实存在极小值等问题,可以提供求偏微分方程边值问题的解(包括近似解)的方法。例如:黎曼在调和函数中使用狄利克雷原理。

E-L方程

欧拉-拉格朗日方程(Euler-Lagrange方程)给出了求泛函极值的方法,满足E-L方程的解可以是极值,或者是某种意义上的临界值,但是未必是极小值,需要满足一定条件,才能确定该解是否是极小值。但是无论如何,它给与了我们求取极小值的一个方法。

本节中只考虑泛函依赖于单变量(可以是向量值)函数的情形。和在数学分析中确定极值条件一样,我们在一个邻域内考虑这个问题,如果在某个点取到极小值,则在该点的邻域,必有不等式

$$ I(u^*+\varepsilon{\varphi})-I(u^*){\ge}0 $$

其中$u^*$为取到极小值的点(或者说函数),而$\varphi$为满足边值条件的任意函数(也称试探函数),即$\forall \varphi{\in}C^1_0(J,R^N)$。

考虑$\varepsilon{\to}0$,可以定义泛函$I$对$\varphi$的一阶变分。对了,这里都取的连续函数,积分与级数可以交换

$$ \begin{align*} {\delta}I(u^*,\varphi)&=\lim_{\varepsilon{\to}0}\frac{1}{\varepsilon}(I(u^*+\varepsilon{\varphi})-I(u^*))\\ &=\int_J(\sum^N_{i=1}\int^{t}_{t_0}L_{u^i}(s,u^*(s),\dot{u}^*(s))ds-L_{p^i}(t,u^*(t),\dot{u^*}(t)))\dot{\varphi^i}(t)dt\\ &{\ge}0 \end{align*} $$

当然,我们如果把$\varepsilon>0$换成$\varepsilon<0$;其实相当于把$\varphi$换为$-\varphi$,从而得到等式

$$ \int_J(\sum^N_{i=1}\int^{t}_{t_0}L_{u^i}(s,u^*(s),\dot{u}^*(s))ds-L_{p^i}(t,u^*(t),\dot{u^*}(t)))\dot{\varphi^i}(t)dt=0 $$

接下来我们需要将这个积分等式中的任意函数$\varphi$去掉,从而得到积分形式的E-L方程。

du Bois-Reymond引理

若$\psi{\in}C[t_0,t_1]$,且

$$ \int_J{\psi(t){\cdot}\dot{\lambda(t)}dt}=0,\forall {\lambda}{\in}C^1_0(J) $$

其中$C^1_0(J)=C^1_0(J,R^1)=\left\{u{\in}C^1(J)|u(t_0)=u(t_1)=0\right\}$,则$\psi=const$。

显然如果有了该引理,那么我们把等式的$\dot{\varphi^i}(t)$当作$\dot{\lambda(t)}$,就可以直接写出E-L方程的积分形式。

证明该引理:该引理证明不困难,其实就是凑了一个常数而已。

令$c=\frac{1}{|J|}\int_J{\psi(t)}dt$且$\lambda(t)=\int_{t_0}^t(\psi(s)-c)ds$,则$\lambda{\in}C^1_0(J)$。因此,

$$ \int_J(\phi(t)-c)^2dt=\int_J\psi(t)(\psi(t)-c)dt=\int_J\psi(t){\cdot}\dot{\lambda(t)}dt=0 $$

又因为$\psi$是连续的,因此就有$\psi=const$。

E-L方程的两个形式

给出定理:设$u^*{\in}M$是泛函$I$在$M$上的一个极小点,则它满足下列积分形式的Euler-Lagrange方程(简称E-L方程):

$$ \int^{t}_{t_0}L_{u^i}(s,u(s),\dot{u}(s))ds-L_{p^i}(t,u(t),\dot{u}(t))=const,1{\le}i{\le}N,\forall t $$

E-L方程是泛函极小值的必要条件,显然它不是充分的。

E-L方程的解是相应泛函$I$的临界点,它可以是极大值或极小值,也可以是其他形式的临界点。

当$L{\in}C^1,u{\in}C^1$时,在广义函数的意义下(保证其微分存在),积分形式的E-L方程又可以改写成微分形式的E-L方程:

$$ -DL_P(t,u(t),\dot{u}(t))+L_u(t,u(t),\dot{u}(t))=0 $$

其中$D$是广义导数。

可以给出关于单变量函数的形式

$$ -\frac{d}{dx}F_{y'}+F_y=0 $$

定义Euler-Lagrange算子$E_L$如下:

$$ (E_Lu)(t)=DL_P(t,u(t),\dot{u}(t))-L_u(t,u(t),\dot{u}(t)) $$

特别地,如果$L{\in}C^2$以及$u{\in}C^2$,那么上式在逐点意义下成立,也就是说可以把$D$换成普通导数$\frac{d}{dt}$

由此,可以把变分问题转化为微分方程求解。

扩大函数类范围

可以将定理中的函数类$C^1(J)$放大一些。例如,考虑利普希茨函数类$Lip(J)$。因为利普希茨函数是绝对连续的,所以几乎处处存在导数$\dot{u}(t)$,而且泛函$I$中的积分可以按照勒贝格积分意义去理解。取

$$ M=\left\{u{\in}Lip(J,\Omega)|u_i(t_i)=P_i,i=0,1\right\} $$

注意:在$M$中,$\forall \delta>0,U=\left\{v{\in}Lip(J)||v(t)-u^*(t)|+|\dot{v}(t)-\dot{u^*}(t)|<\delta,a.e.t{\in}J\right\}$是$u^*$的一个邻域。

而这个时候E-L方程仍然在勒贝格意义下对几乎所有的$t{\in}J$成立

$$ \int^{t}_{t_0}L_{u^i}(s,u(s),\dot{u}(s))ds-L_{p^i}(t,u(t),\dot{u}(t))=const,1{\le}i{\le}N $$

事实上上式的成立,我们需要一个积分与极限交换的操作,这里用到勒贝格控制收敛定理。因为这时$\dot{u}$几乎处处存在且有界,从而存在$(u(t),\dot{u}(t))$的一个紧邻域$W{\subset}\Omega{\times}R^N$,使得$L$的导数在$J{\times}W$上有界,我们可以得到

$$ \begin{align*} {\delta}I(u^*,\varphi)&=\lim_{s{\to}}\frac{1}{s}(I(u^*+s\varphi)-I(u^*))\\ &=\lim_{s{\to}}\frac{1}{s}\int_J[(L(t,u^*(t)+s\varphi(t),\dot{u^*}(x)+s\dot{\varphi}(x))-L(t,u^*(t),\dot{u^*}(t))]dt\\ &=\int_J\sum^n_{i=1}[L_{u^i}(t,u^*(t),\dot{u^*}(t))\varphi^i(t)+L_{p^i}(t,u^*(t),\dot{u^*}(t))\dot{\varphi^i}(t)]dt \end{align*} $$

这是因为积分号内的差有一致的控制,求导过程可以用勒贝格控制定理来保证积分号下取极限。

同时在du Bois-Reymond引理中我们可以把$\varphi{\in}C^1(J)$换成$\varphi{\in}L^{\infty}(J)$,把$\lambda{\in}C^1_0(J)$换成$\lambda{\in}AC_0(J)$,即边值为0的$J$上的绝对连续函数空间

对于利普希茨函数类可以成立,其实我们可以再放大到逐段$C^1$的连续函数($PWC^1(J,R^N)$)(也就是存在有限点集$D=\left\{a_1,\cdots,a_k\right\}$使得$u{\in}C^1(J{\backslash}D)$,而且$\dot{u}(a_i{\pm}0)$都存在,$i=1,\cdots,k$)是利普希茨函数。因此积分形式的E-L方程对于逐段$C^1$的连续函数类成立。

局部性(变分导数)

上述的E-L方程的推导过程虽然是在整个区间$J$上进行的,但对$\forall c{\in}int(J)$,在这点的E-L方程实际上只依赖于这点邻近$L$的行为,也就是只依赖于包含$c$的任意邻域$(c-h,c+h){\subset}int(J)$。因为支集在$(c-h,c+h)$内的试探函数$\varphi$显然在$C^0_1(J,\mathbb{R}^N)$内,由这些函数的任意性就导出了在$(c-h,c+h)$上的E-L方程。

实际上我们可以通过极限过程来看这种局限性。以$N=1$为例,并假设$L{\in}C^2,u{\in}C^2$。

$$ \begin{align*} \lim\frac{I(u+\varphi)-I(u)}{\Delta {\sigma}}&=-\lim\frac{\int^{c+h}_{c-h}\int^t_{t_0}E_L(u+{\theta}\varphi)(s)\dot{\varphi}(t)dt}{\Delta {\sigma}}\\ &=\lim\frac{\int^{c+h}_{c-h}E_L(u+{\theta}\varphi)(t){\varphi}(t)dt}{\Delta {\sigma}}\\ &=E_L(u)(c) \end{align*} $$

其中$\theta=\theta(t){\in}(0,1)$,$\varphi$的支集在$(c-h,c+h)$内,${\Delta}\sigma=\int^{c+h}_{c-h}\varphi(t)dt$是曲线$u(t)+\varphi(t)$与曲线$u(t)$在$t{\in}(c-h,c+h)$之间所夹的面积,而极限过程是

$$ h{\to}0,\sup_{t{\in}[c-h,c+h]}|\dot{\varphi}(t)|{\to}0 $$

在这个意义上,我们称E-L算子对函数$u$作用后在$t$点的值

$$ (E_Lu)(t)=DL_P(t,u(t),\dot{u}(t))-L_u(t,u(t),\dot{u}(t)) $$

为$I$在$t$的变分导数

边值条件

上面求解过程都要求了定义域两端是固定的,也就是在区间$J$的两个端点加以限制,那么自然我们会考虑如果不加以限制,那么泛函$I$的极值函数$u^*$应该满足怎么样的方程和边值条件?

我们之前选取试探函数$\varphi$的时候,保证了该试探函数在端点处为0,因此$u=u^*+\varepsilon{\varphi}$与$u^*$是具有同样的端点值的。而对于现在这种情况,我们没有必要再对$\varphi$的端点值做出任何限制,也就是说$C^1(J,\mathbb{R}^N)$中的函数$\varphi$都可以用来构造$u$。

下面分析一下这种情况:假设$u^*{\in}C^2(J,\mathbb{R}^N)$,那么由分部积分公式

$$ \begin{align*} \delta{I(u^*,\varphi)}&=\int_J(\sum^N_{i=1}\int^{t}_{t_0}L_{u^i}(s,u^*(s),\dot{u}^*(s))ds-L_{p^i}(t,u^*(t),\dot{u^*}(t)))\dot{\varphi^i}(t)dt\\ &=-\int_J(\sum^N_{i=1}[L_{u^i}(t,u^*(t),\dot{u^*}(t))-\frac{d}{dt}L_{p^i}(t,u^*(t),\dot{u^*}(t))]){\varphi^i}(t)dt\\ &-\sum^N_{i=1}[L_{p^i}((t,u^*(t),\dot{u^*}(t))\varphi^i(t)|^{t_1}_{t_0}] \end{align*} $$

注意到$C^1_0(J,\mathbb{R}^N){\subset}C^1(J,\mathbb{R}^N)$,所以在上式中先取任意的$\varphi{\in}C^1_0(J,\mathbb{R}^N)$,可以得到同样的E-L方程,然后再任取$\varphi{\in}C^1(J,\mathbb{R}^N)$(实际上只是任意取$\varphi$在端点的值),因为这个时候右端的第一项已经消失(E-L方程与$C^1_0(J,\mathbb{R}^N)$),而第二项中$\varphi^i(t_j)(j=0,1,i=1,\cdots,N)$是任意的,因此满足方程

$$ L_{p^i}((t_j,u^*(t_j),\dot{u^*}(t_j))=0,i=1,\cdots,N,j=0,1. $$

当然定义域$M$还可以有很多其他的取法,例如一个端点的函数值固定,另一个不固定;还可以对向量值函数的不同分量采用不同的端点条件。还可以考虑一些其他类型的边值条件:周期条件、自由边值等。

注意:在上面边值条件的讨论中,我们始终假设定义域$M$中的函数是连续可微的。如果把连续可微函数类换成逐段连续$C^1$的函数类,虽然E-L方程不变(局部性),但是在导数的跳跃点上需要添加角点条件

第一Erdmann角点条件:$\dot{u}_0(t^*-0){\neq}\dot{u}_0(t^*+0)$,则

$$ L_{p^i}(t^*,u_0(t^*),\dot{u^*}(t-0))=L_{p^i}(t^*,u_0(t^*),\dot{u^*}(t+0)),i=1,\cdots,N $$

第二Erdmann角点条件:

$$ L(t^*,u_0(t^*),\dot{u^*}(t-0))-\sum^N_{i=1}L_{p^i}(t^*,u_0(t^*),\dot{u^*}(t-0))\\ =L(t^*,u_0(t^*),\dot{u^*}(t+0))-\sum^N_{i=1}L_{p^i}(t^*,u_0(t^*),\dot{u^*}(t+0)),i=1,\cdots,N $$

这是在逐段连续$C^1$函数类上满足角点条件才能有解。

求解E-L方程的例子

泛函变分问题的一般求解步骤:

  1. 从物理上建立泛函及其条件
  2. 通过泛函变分,利用变分原理将泛函极值转为求其欧拉-拉格朗日方程
  3. 在边界条件下求解该方程,即微分方程求解

这里我们考虑$N=1$的几种特殊情形下E-L方程的简化过程。

情形1:$L$不含$u,L=L(t,p)$。

这个时候有

$$ \frac{d}{dt}L_p(t,\dot{u}(t))=0 $$

这个$L_p(t,\dot{u}(t))=c$是一个不含$u$的一阶方程,如果能够解出$\dot{u}$(例如满足必要条件$L_{pp}(t,p){\neq}0$)则可以得到

$$ \dot{u}(t)=g(t,c) $$

那么也就可以通过积分得出$u(t)$。

例子:设$M=\left\{u{\in}C^1([1,2])|u(1)=0,u(2)=1\right\}$

$$ I(u)=\int^2_1\sqrt{1+\dot{u}^2}\frac{dt}{t} $$

求使得泛函$I$达到极小的函数$u$。

解:因为$L=t^{-1}\sqrt{1+p^2}$,所以由E-L方程得

$$ L_p=\frac{p}{t\sqrt{1+p^2}}=C $$

也就是得到

$$ \dot{u}^2(1-C^2t^2)=C^2t^2\quad 或\quad \dot{u}=\frac{Ct}{{\pm}\sqrt{1-C^2t^2}} $$

这样我们把符号直接吸收到常数$C$里面去,再进行积分

$$ u=\frac{1}{C}\sqrt{1-C^2t^2}+C_1 $$

最后代入边值条件,得到$C=\frac{1}{\sqrt{5}},C_1=2$,于是得到解

$$ (u-2)^2+t^2=5 $$

情形2:$L$不含$p,L=L(t,u)$

这个时候E-L方程成为一个函数方程

$$ L_u(t,u)=0 $$

其解是一条或者几条曲线

例子:$I(u)=\int^b_a(t-u)^2dt$,其E-L方程是

$$ 2(u-t)=0 $$

也就是直线$u=t$。

情形3:自守系统。$L$与$t$无关,$L=L(u,p)$。

这个时候我们需要学一招:引入哈密顿(Hamilton)量!

$$ H(u,p)=pL_p(u,p)-L(u,p) $$

并且有一个关于该量的定理:设$L{\in}C^2$,且与$t$无关,又这$u{\in}C^2(J,\mathbb{R}^1)$是E-L方程得解,我们有

$$ H(u(t),u'(t))=const,\forall t $$

证明:直接计算可得

$$ \frac{d}{dt}H(u(t),u'(t))=u'(t){\cdot}E_L(u)(t)=0 $$

因为$E_L(u)(t)=0$,这是因为$u$是E-L方程的解。

例子:最速下降线,这个时候有

$$ L(u,p)=\frac{1}{\sqrt{2g}}\frac{\sqrt{1+p^2}}{\sqrt{y_1-u}} $$

利用哈密顿量的定理,则有

$$ pL_p-L|_{(u,u')}=const $$

也就是有常数$c$使得

$$ -\frac{\sqrt{1+u'^2}}{\sqrt{y_1-u}}+\frac{u'^2}{\sqrt{(1+u'^2)(y_1-u)}}=c $$

因此推出

$$ c^2(1+u'^2)(y_1-u)=1 $$

我们令$k$为一个待定正常数,作变量替换,引入参变量$\theta$

$$ \begin{cases} x=x({\theta})\\ y=y({\theta}) \end{cases} $$

并且令

$$ u(\theta)=y_1-k(1-cos{\theta}) $$

$$ c^2(1+k^2\frac{sin^2{\theta}}{\dot{x}(\theta)^2})k(1-cos\theta)=1 $$

取$c=\sqrt{\frac{1}{2k}}$,则有

$$ \dot{x}(\theta)=k(1-cos{\theta}) $$

就得到我们所要的参数曲线

$$ \begin{cases} x(\theta)=x_1+k(1-cos{\theta})\\ u(\theta)=y_1-k(1-cos{\theta})\\ \theta{\in}[0,\Theta] \end{cases} $$

再通过边值条件

$$ \begin{cases} x({\Theta})=x_2\\ y(\Theta)=y_2 \end{cases} $$

确定$k$和$\Theta$。

关于两个物理量

一个是拉格朗日作用量$L$

$$ L=T-V $$

其中$T$为动能,$V$为位能。拉格朗日作用量在作为泛函进行求极小轨道的时候,可以导出牛顿第二定律$F=ma$。是描述整个物理系统的动力状态的函数,一般用于计算此系统的运动方程。

另一个是哈密顿作用量$H$

$$ H(u,p)=pL_p(u,p)-L(u,p) $$

是之前引入的,在质点组中的$H$代表的是机械能,$H$恒定则代表该运动过程中,质点组的机械能守恒。

泛函极值的必要及充分条件

这里我们回顾一下数学分析中对于函数取极值的相关问题:设$f{\in}C^2(\Omega,\mathbb{R}^1),{\Omega}{\in}\mathbb{R}^n$是一个开集,$x_0{\in}{\Omega},\nabla{f(x_0)}=0$。问题是$x_0$成为$f$的极小点的必要条件是?充分条件是?

根据简单的试探函数求取,我们得到必要条件是

$$ d^2f(x_0)=\frac{\partial^2}{\partial{x_i}\partial{x_j}}f(x_0) $$

是非负定的。

而充分条件则是,上述矩阵$d^2f(x_0)$是正定的。

二阶变分

这启示我们对泛函的极小值问题也用这种方法进行,我们知道满足E-L方程是一阶变分的条件,而这个只是极小的一个必要条件,并不充分。从泛函分析和微分拓扑的角度看,满足E-L方程的解$u_0$只是泛函的临界点,需要通过二阶变分才能判断是否成为极小。

设$L{\in}C^2(J{\times}\mathbb{R}^N{\times}\mathbb{R}^N)$,

$$ I(u)=\int_JL(t,u(t),\dot{u}(t))dt $$

又设$u_0{\in}M$是泛函$I$的E-L方程的解:

$$ E_L(u_0)=0 $$

现在$\varphi{\in}C^{\infty}_0(J,\mathbb{R}^N)$,如果令

$$ g(s)=I(u_0+s{\varphi}) $$

那么一元函数$s{\to}g(s)$便以0为极小点。

我们把

$$ \begin{align*} \delta^2I(u_0,\varphi)&=\ddot{g}(0)\\ &=\frac{d^2}{ds^2}I(u_0+s{\varphi})|_{s=0}\\ &=\frac{d^2}{ds^2}\int_J[L(t,u_0(t),\dot{u_0}(t))\varphi^i(t)\varphi^j(t)+2L_{u^ip^j}(t,u_0(t),\dot{u_0}(t))\varphi^i(t)\varphi^j(t)\\ &+L_{p^ip^j}(t,u_0(t),\dot{u_0}(t))\dot{\varphi}^i(t)\dot{\varphi}^j(t)]dt \end{align*} $$

称为$I$在$u_0$沿$\varphi$的而二阶变分

接下来给出必要条件和充分条件的相关信息:

一,如果$u_0$是极小点,则必然有$\ddot{g}(0){\ge}0$,也就是

$$ \delta^2I(u_0,\varphi){\ge}0,\forall{\varphi}{\in}C^1_0(J,\mathbb{R}^N) \tag{3.1} $$

二,若$u_0{\in}C^1_0(J,\mathbb{R}^N)$满足E-L方程,并且存在$\lambda>0$,使得

$$ \delta^2I(u_0,\varphi){\ge}{\lambda}\left\{|\varphi|^2+|\dot{\varphi}|^2\right\}dt,\forall {\varphi}{\in}C^1_0(J,\mathbb{R}^N) \tag{3.2} $$

则$u_0$是$I$的一个严格极小点。

但是我们会发现上面还带有任意函数$\varphi$,这不是我们想要的。

对于充分条件怎么出来的我们进行一个揭示,首先有

$$ g(s)-g(0)=g(s)-g(0)-\dot{g}(0)s=\frac{s^2}{2}\ddot{g}({\theta}s)=\frac{s}{2}[\ddot{g}({\theta}s)-\ddot{g}(0)]+\frac{s^2}{2}\ddot{g}(0) $$

其中$\theta{\in}(0,1)$依赖于$\varphi$。

我们引入以下函数矩阵和它们沿函数$u_0(t)$的限制化简这个形式:

$$ A=(L_{{p^i}{p^j}}(t,u,p)),A_{u_0}=((L_{{p^i}{p^j}}(t,u_0(t),\dot{u_0}(t))),\\ B=(L_{{p^i}{u^j}}(t,u,p)),B_{u_0}=((L_{{p^i}{u^j}}(t,u_0(t),\dot{u_0}(t))),\\ C=(L_{{u^i}{u^j}}(t,u,p)),C_{u_0}=((L_{{u^i}{u^j}}(t,u_0(t),\dot{u_0}(t))),\\ $$

我们有

$$ \delta^2I(u_0,\varphi)=\int_J[(A_{u_0}\dot{\varphi},\dot{\varphi})+2(B_{u_0}\dot{\varphi},{\varphi})+(C_{u_0}{\varphi},{\varphi})]dt $$

因为

$$ \ddot{g}(s)=\int_J[(A_{u_0+s{\varphi}}\dot{\varphi},\dot{\varphi})+2(B_{u_0+s{\varphi}}\dot{\varphi},{\varphi})+(C_{u_0+s{\varphi}}{\varphi},{\varphi})]dt $$

而且$L{\in}C^2$,所以对于$\|\varphi\|_{C^1(J)}{\le}1$当$s{\to}0$,一致地有

$$ |A_{u_0+s{\varphi}}-A_{u_0}|+|B_{u_0+s{\varphi}}-B_{u_0}|+|C_{u_0+s{\varphi}}-C_{u_0}|=o(1) $$

即得

$$ \ddot{g}(s)-\ddot{g}(0)=o(s^2)\int_J[|\nabla{\varphi}|^2+|\varphi|^2]dt $$

从而$\forall \varphi{\in}C^1_0(J,\mathbb{R}^N)$,当$|s|$充分小时,存在$\varepsilon<{\lambda}$使得

$$ I(u_0+s{\varphi})-I(u_0){\ge}(\lambda-\varepsilon)\int_J[|\dot{\varphi}|^2+|\varphi|^2]dt $$

接下来我们考虑对$A_0,B_0,C_0$在判定$u_0$成为极小点的地位。

勒让德-阿达马条件

三个矩阵$A_0,B_0,C_0$在判定$u_0$成为极小点的地位是不平等的。接下来我们要说明只有$A_{u_0}$项是起作用的。

事实上,$\forall \tau{\in}int(J),\forall \xi{\in}\mathbb{R}^N,\forall \mu>0$充分小,取$v{\in}C^1({\mathbb{R}^1}),v(s)=0$,当$|s|{\ge}1$,满足$\int_{\mathbb{R}^1}\dot{v}(s)^2ds=1$。令

$$ \varphi(t)=\xi{\mu}v(\frac{t-{\tau}}{\mu}) $$

$$ \dot{\varphi}(t)=\xi\dot{v}(\frac{t-{\tau}}{\mu}) $$

当$\forall{\mu}>0$充分小时,

$$ \int_J{\dot{\varphi}_i\dot{\varphi}_jdt}=\xi_i{\xi_j}{\mu},A_{u_0}对应项\\ \int_J{\dot{\varphi}_i\varphi_j}dt=\xi_i\xi_j{\mu^2}\int_{\mathbb{R}^1}v(t)\dot{v}(t)dt,B_{u_0}对应项\\ \int_J{{\varphi}_i\varphi_j}dt=\xi_i\xi_j{\mu^3}\int_{\mathbb{R}^1}v(t)^2dt,C_{u_0}对应项 $$

代入二阶变分(3.1),令$u{\to}0$,我们得到

$$ \delta^2I(u_0,\varphi)=\mu(A_{u_0}\xi,\xi)+o(\mu) $$

于是可以引入下列的勒让德-阿达马(Legendre-Hadamard)条件

$$ (A_{u_0}\xi,\xi)=\sum^N_{i,j=1}L_{p^ip^j}(\tau,u_0(\tau),\dot{u}_0(\tau))\xi^i\xi^j{\ge}0,\forall{\tau}{\in}J,\forall{\xi}{\in}\mathbb{R}^N.\tag{3.3} $$

注意到勒让德-阿达马条件确实是极小点的必要条件。

如果$\exists {\lambda}>0$,使得

$$ \sum^N_{i,j=1}L_{p^ip^j}(\tau,u(\tau),\dot{u}(\tau))\xi^i\xi^j{\ge}{\lambda}|\xi|^2,\forall{\tau}{\in}J,\forall{\xi}{\in}\mathbb{R}^N.\tag{3.4} $$

那么就称之为严格的勒让德-阿达马条件。但是,这个严格的勒让德-阿达马条件不是极小点的充分条件。

定理3.1:设$L{\in}C^2(J{\times}\mathbb{R}^N{\times}\mathbb{R}^N)$,若$u_0{\in}M$是$I$的一个极小点,则勒让德-阿达马条件(3.3)成立。反之,若$u_0{\in}M$满足E-L方程,而且存在一个$\lambda>0$使得(3.2)成立,则$u_0$是$I$的一个严格极小点。

这样我们就可以用$A_{u_0}$的对应项去衡量严格极小点的充分性,这样可以忽略掉那些高阶小量。

接下来,我们更进一步,想要把(3.2)中含有任意函数$\varphi$,换成一个不含$\varphi$的条件,因此要建立它和严格的勒让德-阿达马条件(3.4)之间的关系。

第一步,我们先在充分条件(3.2)右边的积分中的项$|\varphi|^2$去掉,我们可以用庞加莱引理,用$\dot{\varphi}$去控制$\varphi$。

庞加莱引理

Poincare引理主要告诉我们一个函数可以用它的导函数来控制。

设$\varphi{\in}C^1_0(J,\mathbb{R}^N)$,则

$$ \int_J|\varphi|^2dt{\le}\frac{(t_2-t_1)^2}{2}\int_J|\dot{\varphi}|^2dt $$

证明:因为

$$ \varphi(t)=\int^{t}_{t_0}\dot{\varphi(s)}ds $$

由施瓦茨不等式(Schwarz),

$$ |\varphi(t)|^2{\le}(\int^{t}_{t_0}|\dot{\varphi}(s)|ds)^2{\le}(t-t_0)\int_J|\dot{\varphi}(s)|^2ds $$

积分后

$$ \int_J|\varphi(t)|^2dt{\le}\frac{(t_1-t_0)^2}{2}\int_J|\dot{\varphi}|^2dt $$

现在可以把(3.2)右端的积分中的$|{\varphi}|^2$去掉了,换成对某个$\lambda>0$

$$ \delta^2I(u,\varphi){\ge}{\lambda}\int_J|\dot{\varphi}|^2dt,\forall{\varphi}{\in}C^1_0(J,\mathbb{R}^N) $$

那么定理3.1仍旧成立。

也就是判断是不是极小点的条件可以进化为如下:

若$u_0{\in}C^1_0(J,\mathbb{R}^N)$满足E-L方程,并且存在$\lambda>0$,使得

$$ \delta^2I(u_0,\varphi){\ge}{\lambda}\left\{|\dot{\varphi}|^2\right\}dt,\forall {\varphi}{\in}C^1_0(J,\mathbb{R}^N) $$

到这一步其实已经可以解决一部分的泛函极值问题,也就是用上面稍微强一点的条件,可以判断E-L的解是不是极小点。

例子:设$L=\sqrt{1+p^2},M=\left\{u{\in}C^1([0,b])|u(0)=u(b)=0\right\}$

由于泛函$I(u)=\int^b_0{\sqrt{1+\dot{u}(t)}dt}$的E-L方程

$$ \frac{d}{dt}\frac{\dot{u}}{\sqrt{1+\dot{u}^2}}=0 $$

有解$u=0{\in}M$。

因为

$$ L_{uu}=L_{up}=L_{pu}=0,L_{pp}=\frac{1}{(1+p^2)^{\frac{3}{2}}} $$

所以

$$ \delta^2I(0,\varphi)=\int^b_0\dot{\varphi}^2dt $$

这样我们可以用到定理3.1,而证明这个$u=0$是一个极小点。

其实我们可以做到更为细致的弱一点的条件,这个从二阶变分的表达式和下面的例子可以看出:

二阶变分的表达式中,对于矩阵

$$ \begin{pmatrix} A_{u_0} & B_{u_0} \\ B_{u_0} & C_{u_0} \end{pmatrix} $$

是正定的,那么其E-L方程的解$u_0$必定是极小点,但是从下面例子可以看出这个矩阵的正定性并不是极小的必要条件,也就是这个条件过分强了。

例子:设$I(u)=\int_J(\dot{u}(t)^2-u(t)^2)dt$,则在$u=0$处有

$$ \begin{pmatrix} A_{0} & B_{0} \\ B_{0} & C_{0} \end{pmatrix}=\begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} $$

这个不是半正定的。

但是当$|J|=t_1-t_0$充分小的时候,由庞加莱不等式,仍旧是有

$$ \delta^2I(0,\varphi)=\int_J(\dot{\varphi}^2-\varphi^2)dt{\ge}(1-\frac{(t_1-t_0)^2}{2})\int_J{\dot{\varphi}^2}dt $$

于是$u=0$还是极小点。

而且严格的勒让德-阿达马条件并不是极小值的充分条件,这促使我们去找一个比较弱的条件作为充分条件,并且最好是不带试探函数$\varphi$的。

Jacobi场

设$L{\in}C^3$,又设$u_0$是E-L的解。设$u_0$令

$$ \Phi_{u_0}(t,\xi,\eta)=(A_{u_0}\eta,\eta)+2(B_{u_0}\xi,\eta)+(C_{u_0}\xi,\xi),\forall(\xi,\eta){\in}\mathbb{R}^N{\times}\mathbb{R}^N $$

这个函数为附属的拉格朗日函数(其实主要思想就是把这个当成一个泛函,且附属与$L$与$u_0$)。

设$u_0$是一个极小点,考察与附属拉格朗日函数相关的变分积分

$$ Q_{u_0}(\varphi)=\int_J\Phi_{u_0}(t,\varphi(t),\dot{\varphi}(t))dt,\forall{\varphi}{\in}C^1_0(J,\mathbb{R}^N) $$

因为$Q_{u_0}=\delta^2I(u_0,\varphi){\ge}0,\forall{\varphi}{\in}C^1_0(J,\mathbb{R}^N)$,而且$Q_{u_0}(\theta)=0$,所以$\theta$为$Q_{u_0}$的极小点。

于是我们现在将泛函$Q_{u_0}$的定义域扩充到$Lip_0(J,\mathbb{R}^N)$(也就是端点为0的利普希茨函数类)上,导出其积分形式的E-L方程:

$$ A_{u_0}\dot{\varphi}(t)+B^T_{u_0}\varphi(t)-\int_{t_0}^t(B_{u_0}\dot{\varphi}(t)+C_{u_0}\varphi(t))dt=const $$

假设$L$沿着$u_0$满足严格的勒让德-阿达马条件,也就是$A_{u_0}$是正定的,那么由上面积分形式的E-L方程,可以知道解$\varphi{\in}C^2(J,\mathbb{R}^N)$。而且$\varphi$还满足一个齐次二阶常微分方程组:

$$ J_{u_0}(\varphi)=\frac{d}{dt}[A_{u_0}\dot{\varphi}(t)+B^T_{u_0}\varphi(t)]-[B_{u_0}\dot{\varphi}(t)+C_{u_0}\varphi(t)]=0,t{\in}J $$

我们称这个方程为Jacobi方程。并且称呼算子$J_{u_0}$为沿着E-L方程的解$u_0$的Jacobi算子

类比数学分析,可以知道雅可比算子是一个二阶线性常微分算子,在变分问题中扮演者海塞矩阵在函数极值中的角色。

我们称雅可比方程的任意一个$C^2$解为沿着轨道$u_0(t)$的一个雅可比场,所有的雅可比场构成一个$2N$维的线性空间。

于是原本对泛函极值的问题,可以转化为在其附属函数$Q_{u_0}$上考虑,我们有如下引理:

引理3.2:给定一个足够光滑的拉格朗日函数$L$,设沿其E-L方程的解$u_0$满足严格的勒让德阿达马条件,也即是$A_{u_0}$是正定的。又如果存在$\mu>0$使得

$$ Q_{u_0}(\varphi){\ge}{\mu}\int_J|\varphi^2|dt, $$

则存在$\lambda>0$使得

$$ Q_{u_0}(\varphi){\ge}{\lambda}\int_J(|\dot{\varphi}|^2+|\varphi|^2)dt $$

从而$u_0$是

$$ I(u)=\int_JL(t,u(t),\dot{u}(t))dt $$

的一个严格极小点。

证明:对于$J$上任意俩连续函数$\varphi,\psi$,令$<\phi,\psi>=\int_J\phi(t)\psi(t)dt$,因为$A_{u_0}$是正定的,所以存在$\alpha>0$使得

$$ <A_{u_0}\dot{\varphi},\dot{\varphi}>{\ge}{\alpha}\int_J|\dot{\varphi}|^2dt $$

$$ Q_{u_0}(\varphi)=<A_{u_0}\dot{\varphi},\dot{\varphi}>+2<B_{u_0}\dot{\varphi},{\varphi}>+<C_{u_0}{\varphi},{\varphi}> $$

推出存在正常数$C_1,C_2$,使得

$$ \begin{align*}{\alpha}\int_J|\dot{\varphi}|^2dt&{\le}Q_{u_0}(\varphi)+C_1((\int_J|\dot{\varphi}|^2dt)^{\frac{1}{2}})(\int_J|{\varphi}|^2dt)^{\frac{1}{2}})+(\int_J|{\varphi}|^2dt))\\&{\le}\frac{\alpha}{2}\int_J|\dot{\varphi}|^2dt+Q_{u_0}(\varphi)+C_2\int_J|\varphi|^2dt\end{align*} $$

再应用条件

$$ \int_J|\varphi|^2dt{\le}{\mu}^{-1}Q_{u_0}(\varphi) $$

得到

$$ \int_J|\dot{\varphi}|^2dt{\le}\frac{\alpha}{2}(1+C_2{\mu}^{-1})Q_{u_0}(\varphi) $$

利用定理3.1以及庞加莱不等式,可以知道$u_0$是$I$的一个严格极小点。

共轭点

接下来通过引入共轭点概念,最后告诉我们可以通过雅可比场来判断解是不是极小值。

共轭点定义:设$u_0$是$I(u)=\int_JL(t,u(t),\dot{u}(t))dt$的E-L方程的一个解,称$(a,u_0(a))$与$(b,u_0(b))$是轨道$(t,u_0(t))$上的一对共轭点,如果存在一个沿$u_0(t)$的非零雅可比场$\varphi{\in}C^1_0([a,b],\mathbb{R}^N)$。

接下来证明一个辅助引理:

设$\varphi_0$是沿$u_0$的一个雅可比场,则$Q_{u_0}(\varphi_0)=0$。反之,若$\varphi_0{\in}Lip_0(J,\mathbb{R}^N)$满足$Q_{u_0}(\varphi_0)=0$,而且$Q_{u_0}(\varphi){\ge}0,\forall{\varphi}{\in}C^1_0(J,\mathbb{R}^N)$,则$\varphi_0$是沿$u_0$的一个雅可比场。

证明:"$ \Rightarrow $"因为$\Phi_{u_0}$对$(\xi,\eta)$是二次齐次的,由Euler公式得到

$$ 2\Phi_{u_0}(t,\xi,\eta)=(\Phi_{u_0})_{\xi}(t,\xi,\eta)\xi+(\Phi_{u_0})_{\eta}(t,\xi,\eta){\eta} $$

如果$\varphi_0{\in}C^1_0([a,b],\mathbb{R}^N),[a,b]{\subset}int(J)$是沿$u_0$的雅可比场,那么

$$ \begin{align*}&2\int^b_a(\Phi_{u_0})(t,\varphi_0(t),\dot{\varphi_0}(t))dt\\&=\int^b_a[(\Phi_{u_0})_{\xi}(t,\varphi_0(t),\dot{\varphi_0}(t))\varphi_0(t)+(\Phi_{u_0})_{\eta}(t,\varphi_0(t),\dot{\varphi_0}(t))\dot{\varphi_0}(t)]dt\\&=\int^b_a[(\Phi_{u_0})_{\xi}(t,\varphi_0(t),\varphi_0(t))-\frac{d}{dt}(\Phi_{u_0})_{\eta}(t,\varphi_0(t),\dot{\varphi_0}(t))]\varphi_0(t)dt\\&=-\int^b_aJ_{u_0}(\varphi_0)dt=0\end{align*} $$

再由$a,b$的任意性,就得到$Q_{u_0}(\varphi_0)=0$。上面式子中运用了分部积分,并且因为$\varphi_0$为沿着$u_0$的一个雅可比场,于是有$J_{u_0}(\varphi_0)=0$

"$ \Leftarrow $"利用光滑函数逼近,就得到

$$ Q_{u_0}(\varphi){\ge}0,\forall{\varphi}{\in}Lip_0(J,\mathbb{R}^N) $$

于是$\varphi_0$是$Q_{u_0}$的一个极小点,由前面的推导可以知道:它满足积分形式的E-L方程,从而也就满足微分形式的E-L方程:$J_{u_0}(\varphi_0)=0$。

定理3.3告诉我们什么时候是没有共轭点的,从而也就是极小值。——雅可比场为正的

定理3.3:设$u_0$是$I(u)=\int_JL(t,u(t),\dot{u}(t))dt$的E-L方程的一个解。又设$A_{u_0}$是正定的。若$\delta^2I(u_0,\varphi){\ge}0,\forall{\varphi}{\in}C^1_0(J,\mathbb{R}^N)$,则不存在$a{\in}(t_0,t_1)$使得$(a,u_0(a))$共轭于$(t_0,u_0(t_0))$。

证明:反证法:如果结论不成立,也就是存在$a{\in}[t_0,t_1],(a,u_0(a))$是$(t_0,u_0(t_0))$的共轭点,也就是存在沿$u_0(t)$的非零雅可比场$\xi{\in}C^2([t_0,a],\mathbb{R}^N)$,满足:$J_{u_0}(\xi)=0,\xi(t_0)=\xi(a)=0$。令

$$ \widetilde{\xi}(t)=\begin{cases}\xi(t),\quad{t}{\in}[t_0,a],\\0,\quad{t}{\in}[a,t_1]\end{cases} $$

则$\widetilde{\xi}{\in}Lip(J,\mathbb{R}^N)$满足$\widetilde{\xi}(t_0)=\widetilde{\xi}(t_1)=0$,而且

$$ Q_{u_0}(\widetilde{\xi})=\int^a_{t_0}\Phi_{u_0}(t,\xi(t),\dot{\xi}(t))dt=0 $$

根据辅助引理,$\widetilde{\xi}{\in}C^2(J,\mathbb{R}^N)$应该满足雅可比方程$J_{u_0}(\widetilde{\xi})=0$,再由于二阶微分方程初值问题的唯一性

$$ \widetilde{\xi}{\equiv}0 $$

这个和$\xi$非零矛盾。

于是,我们可以通过共轭点来导出雅可比场对极小值点的充分条件

定理3.4:若$N=1,u_0{\in}C^1(J)$是E-L方程的一个解,设$\exists{\lambda}>0$,使得$A_{u_0}(t){\ge}{\lambda},\forall{t}{\in}J$,而且在$J$上存在一个正的雅可比场$\psi>0$,则$u_0$是一个严格极小点。

证明:记

$$ \alpha=\inf_{J}(A_{u_0}(t)\psi^2(t))>0 $$

$\forall{\varphi}{\in}C^1_0(J)$,由庞加莱不等式和引理3.3,可以得到

$$ \begin{align*}Q_{u_0}(\varphi)&=\int_JA_{u_0}\psi^2(\frac{\varphi}{\psi})'^2dt\\&{\ge}{\alpha}\int_J(\frac{\varphi}{\psi})'^2dt\\&{\ge}{\alpha}\frac{1}{|J|^2}\int_J(\frac{\varphi}{\psi})^2dt\\&{\ge}a\inf_J(\frac{1}{\psi^2})\frac{1}{|J|^2}\int_J\varphi^2dt\end{align*} $$

所以存在$\mu>0$,使得

$$ Q_{u_0}(\varphi){\ge}{\mu}\int_J|\varphi|^2dt $$

再用引理3.2可以立刻得到结论。

所以现在解决问题的方法变成这样了:

1,给出泛函极值问题,然后求取E-L方程。

2,考虑$L_{pp}$是否大于0,大于0保证了满足极小值的必要条件

3,考虑其附属变分方程,然后得到雅可比方程,求解(雅可比场)

4,确定该解是否恒为正值,如果恒为正,则表示没有共轭点存在,为极小值点。

Last modification:November 28th, 2019 at 10:57 am
如果觉得我的文章对你有用,请随意赞赏