2.3 关于拉格朗日乘子法的预备知识

本节将介绍关于拉格朗日乘子法的预备知识,拉格朗日乘子法可用于求解含等式约束的优化问题。

1.基本原理

含等式约束优化问题的数学模型为

img

(2.51)

式(2.51)的求解方法可见如下命题。

【命题2.14】imgimg均为连续一阶可导函数,记向量img是式(2.51)的局部最优解,imgimg的梯度向量(即有img),img是函数img的Jacobian矩阵(即有img),并且img是行满秩矩阵,则存在img维列向量img满足

img

(2.52)

【证明】由于向量img是式(2.51)的局部最优解,它一定也是可行解,于是满足img。另一方面,由于imgimg阶行满秩矩阵,其中必然存在img阶子矩阵是可逆的,不失一般性,假设其中前img列构成的子矩阵可逆,则根据隐函数定理可知,在img的某个img-领域内,基于方程组img可以确定将img的前img个变量img表示成关于其后img个变量img的闭式函数,不妨将该函数记为img,于是下面仅需要考虑对向量img进行优化即可。

现将矩阵img按列分块表示为img,其中imgimg的前img列构成的子矩阵(可逆),imgimg的后img列构成的子矩阵,则在向量img处通过对恒等式img求一阶导数可以建立如下等式:

img

(2.53)

接着将向量img按行分块表示为img。其中,imgimg的前img个分量构成的子向量,imgimg的后img个分量构成的子向量。由于向量img是式(2.51)的局部最优解,于是有

img

(2.54)

将式(2.53)代入式(2.54)中可得

img

(2.55)

若令img,则有

img

(2.56)

将式(2.56)中的两个等式合并可得

img

(2.57)

证毕。

命题2.14间接给出了求解式(2.51)的方法,即拉格朗日乘子法。为了求解式(2.51)可以构造如下拉格朗日函数:

img

(2.58)

式中,img称为拉格朗日乘子。式(2.51)的最优解imgimg需要满足如下等式:

img

(2.59)

可以将式(2.59)看成关于imgimg的方程组,其中的方程个数为img,未知参数个数也为img。在一些特殊情况下,该方程组存在闭式解,但是在绝大多数情况下,该方程组并不存在闭式解,需要通过数值技术来进行求解。

2.两种数学优化模型

下面将讨论本书涉及的两种数学优化模型,第1种模型存在最优闭式解,第2种模型则不存在最优闭式解。

首先考虑第1种模型。设列满秩矩阵img、正定矩阵img、向量img及向量组img,相应的数学优化模型为

img

(2.60)

式(2.60)对应的拉格朗日函数为

img

(2.61)

式中,img,假设其为列满秩矩阵。根据式(2.59)可知,式(2.60)的最优解imgimg应满足如下等式:

img

(2.62)

由式(2.62)中的第1式可得

img

(2.63)

将式(2.63)代入式(2.62)中的第2式可得

img

(2.64)

最后将式(2.64)代入式(2.63)中可得

img

(2.65)

从上述推导中不难发现,优化模型式(2.60)的最优闭式解存在,这是因为其中的等式约束为线性约束。

接着考虑第2种模型。设列满秩矩阵img、正定矩阵img、向量img、向量组img、对称矩阵组img及标量组img,相应的数学优化模型为

img

(2.66)

式(2.66)对应的拉格朗日函数为

img

(2.67)

根据式(2.59)可知,式(2.66)的最优解imgimg应满足如下等式:

img

(2.68)

由式(2.68)中的第1式可得

img

(2.69)

将式(2.69)代入式(2.68)中的第2式可得

img

(2.70)

不难发现,式(2.70)是关于img的非线性方程,需要通过迭代或多项式求根的方式进行数值求解,将img的数值解代入式(2.69)中即可得到最优解img。从上述推导中不难发现,由于img的最优闭式解并不存在,因此优化模型式(2.66)的最优闭式解无法获得,需要利用数值技术进行求解,这是因为其中的等式约束为非线性约束(事实上为二次约束)。