首页 > 编程知识 正文

漫步数学分析三十七极大值与极小值的区别,数学极大值和极小值

时间:2023-05-06 15:01:30 阅读:240796 作者:1160

定理10有一个非常重要的应用,它给我们提供了确定函数极大值与极小值的方法。我们期望从单变量函数的相关知识来得出二阶导数的判定准则,所以我们先回顾一下实变量实况。

如果 f:R→R 在 x0 处有一个局部极大或极小,并且 f 在x0处可微,那么 f′(x0)=0 。更进一步,如果 f 二次连续可微,并且若f′′(x0)<0,那么 x0 是局部最大值,若 f′′(x0)>0 ,那么它是局部最小值。

为了将这些事实推广到函数 f:A⊂Rn→R 上,我们首先从相关定义开始。

定义6 令 f:A⊂Rn→R ,其中 A 是开集。如果存在一个x0∈A的邻域并且在这个邻域内 f(x0) 是最大值,即对于邻域内的所有 x,f(x0)≥f(x) ,我们称 f(x0) 是 f 的局部最大值。同样的,我们可以定义f的局部最小值。如果一个点要么是 f 的局部最大值要么是最小值,那么我们称该点是极值点(extreme),如果f 在点 x0 处可微且 Df(x0)=0 ,那么我们称 x0 是驻(critical)点。

第一个基本事实可以用下面的定理来表述。

定理11 如果 f:A⊂Rn→R 是可微的, A 是开集,如果x0∈A是 f 的一个极值点,那么Df(x0)=0;即 x0 是一个驻点。

它的证明大部分与基本微积分是一样的,因为 f 图像的极值点肯定有一个水平切平面,所以这个结论直观上非常明显。然而,仅仅是驻点不能保证该点就是极值点。例如考虑函数f(x)=x3,因为 Df(0)=0 ,所以 0 是该函数的驻点,但是x>0时 x3>0 ,而 x<0 时 x3<0 ,所以0不是极值。另一个例子是 f(x,y)=y2−x2 , 0=(0,0) 是驻点,因为 ∂f/∂x=−2x,∂f/∂y=2y ,所以 Df(0,0)=0 。然而在0的任何邻域内我们可以找出使得 f 大于零与小于0的点。不是局部极值的驻点称为鞍点(saddle point),图1说明了为了用这个术语。

对于f:A⊂R→R,我们已经说明如果 f′(x)=0,f′′<0 ,那么它有局部最大值,回忆一下几何情况, f′′<0 意味着 f 是向下凹的。为了推广,下面我们引进函数g在点 x0 处jqddy(Hessian)的概念。

定义7 如果 g:B⊂Rn→R 是 C2 类,那么 g 在x0处的jqddy定义为双线性函数 Hx0(g):Rn×Rn→R ,形式为 Hx0(g)(x,y)=−D2g(x0)(x,y) (注意负号),从而jqddy仅仅是二阶偏微分的矩阵加负号。

双线性形式,即双线性映射 B:Rn×Rn→R 称为正定的(positive definite),如果对于 Rn 中所有的 x≠0,B(x,x)>0 。称为半正定的(positive semidefinite),如果对于 Rn 中所有的 x≠0,B(x,x)≥0 。负定与半负定双线性形式定义类似。



图1

接下来我们推广到多变量的情况。

定理12

如果 f:A⊂Rn→R 是定义在开集 A 上的C2函数,并且 x0 是 f 的驻点使得Hx0(f)是正定的,那么 f 在x0处有一个局部最大值。如果 f 在x0处有一个局部最大值,那么 Hx0(f) 是半正定的。

对于极小值的情况只需要将上面定理中的正改成负即可,注意 f 的最小值就是−f的最大值。

Hx0(f) 对标准基的矩阵是

⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜−∂2f∂x1∂x1⋅⋅⋅−∂2f∂xn∂x1⋯⋯−∂2f∂x1∂xn⋅⋅⋅−∂2f∂xn∂xn⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟

其中偏导数都是在 x0 处计算的。

当 n=1 时,定理12 (i) 简化为单变量测试 f′′(x0)<0 。如果 f′′(x0)=0 ,那么函数有极大值或极小值或鞍点,(此时测试失效)例如 f(x)=−x4,x5,x4 在 x0=0 处分别有最大值,鞍点与极小值,虽然他们的 f′′(x0)=0 。

提及一些线性代数的知识可能比较有帮助,令 Δk 是矩阵

⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜−∂2f∂x1∂x1⋅⋅⋅−∂2f∂xk∂x1⋯⋯−∂2f∂x1∂xk⋅⋅⋅−∂2f∂xk∂xk⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟

的行列式,这个矩阵就是jqddy矩阵去掉最后 n−k 行和列得到的,那么对称矩阵 Hx0(f) 是正定的,当且仅当对所有的 k=1,…,n,Δk>0 ,它是半正定的当且仅当对所有 k=1,…,n,Δk≥0 。这里我们不证明一般情况,在下面的例1中,我们证明 2×2 矩阵,下面还给出了负定的判别准则,从而对 k=1,…,n ,如果 Δk>0 ,那么 f 在驻点x0处有(局部)最大值,这可能是应用定理12 的最佳方式。对任意 k 如果Δk<0,那么 f 在x0 处没有最大值。同样的,如果 Hx0(f) 是负定的,那么 f 在x0处有(局部)最小值。通过改变 Hx0(f) 的符号以及利用行列式的性质,可以得出如果 k 为奇数时Δk<0, k 为偶数时Δk>0,那么 Hx0(f) 是负定的,如果 k 为奇数时Δk≤0, k 为偶数时Δk≥0,那么 Hx0(f) 是负定的,从而当 k 为奇数时Δk<0,当 k 为偶数时Δ>0,那么 f 在x0处有最小值。

如果对某些奇数 k,Δk>0 ,对某些偶数 k,Δ<0 ,那么 f 在x0处不可能有最小值。事实上,如果对面某些 k,Δk<0 , f 在x0既没有最大值也没有最小值, x0 肯定是 f 的鞍点。

这个定理在力学中也非常有用,这时f是一个系统的势能,那么最小值对应稳定态,最大值与鞍点对应不稳定态。

例1: 说明矩阵

[abbd]

是正定的,当且仅当 a>0,ad−b2>0 。

解: 正定意味着

如果(x,y)≠(0,0),那么[xy][abbd][xy]>0

即 ax2+2bxy+dy2>0 。首先假设对于所有的 (x,y)≠(0,0) 该不等式均成立,令 y=0,x=1 我们得到 a>0 ,令 y=1 ,那么对所有的 x ,我们有ax2+2bx+d>0,这个函数是抛物线且在 2ax+2b=0 处有最小值(因为 a>0 ),即 x=−b/a ,从而

a(−ba)2+2b(−ba)+d>0

即 ad−b2>0 。反过来可以用同样的方式来证明。

例2: 研究 f(x,y)=x2−xy+y2 鞍点 (0,0) 的性质。

解: 这里

∂f∂x=2x−y, ∂2f∂x2=2, ∂2f∂x∂y=−1, ∂f∂y=−x+2y, ∂2f∂y2=2

所以jqddy矩阵是

[−211−2]

这里 Δ1=−2<0,Δ2=4−1=3>0 ,所以jqddy矩阵是负定的,从而我们有一个局部最小值。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。