透彻解析拉格朗日乘数法

文摘 2024-09-15 08:02 荷兰

拉格朗日乘数法是在推导主成分分析时重要的数学技巧，今天这篇文章就来总结一下我对拉格朗日乘数法的学习。

我们先来一个简单的例子，假如x是一个长度为D的向量，其中包含了x₁,…,x_D个随机变量。现在又有一函数f(x)，我们想知道当x₁²+…+ x_D²=1，也就是x^Tx=1时，f(x)的最大值是多少。

假如没有这个约束条件，那么我们可以能会选择对f(x)求一阶导使其等于0，然后我们这些拐点用二阶导验证其是否为Local maximum，最后比较得出Global maximum。

这个方法有两个问题，第一个最直接的问题就是没有考虑到约束条件x^Tx=1；其次，如果f(x)关于x单调递增，那么直接求导将没有办法帮助我们找到需要的结果。

所以，为了找到满足约束条件的前提下的f(x)的最大值，我们需要使用拉格朗日乘数法。

在具体讲解拉格朗日乘数法如何解决本例子之前，我们先来看一个更普适性的例子，假如我们有以下函数：

【函数1】

其中λ为我们新引入的变量。大家可以想象，如果这时我们想要寻找该函数的极值，需要使两个偏导都等于0：

关于λ的偏导是十分容易的，它就等于g(x)，也就是说对于所有满足g(x)=0的x，其中有一个x能够使整个函数1取到最大值。而由于g(x)始终为0，所以这个最大值也是当g(x)=0时，f(x)的最大值。

上面的逻辑有一些tricky，大家可以多读几遍消化一下。总得来说，我们通过在f(x)后面添加一个新项，保证我们求出来了当g(x)=0时，f(x)的最大值。大家肯定发现了这个结果与我们前述情境的目标完美契合（我们想知道当x₁²+…+ x_D²=1，也就是x^Tx=1时，f(x)的最大值是多少）。我们可以令g(x)=1-x^Tx，那么遵照前述的方法，我们就可以计算出当1-x^Tx=0，也就是x^Tx=1时，f(x)的最大值。

这一方法就被称为拉格朗日乘数法（Lagrange Multiplier Method），而其中新加项的λ即为相应的拉格朗日乘数（Lagrange Multiplier）。

我们来将上述方法运用到具体的实例中，假如：

那么我们可以运用拉格朗日乘数法，添加一项新项：

对其关于x求导：

将结果等于0即可得出：

所以，通过拉格朗日乘数法，我们发现了所有矩阵S的特征向量能够使f(x)=x^TSx达到极值。那么我们如何判断哪个特征向量能够使其取到最大值呢？我们可以在方程两边左乘x^T，即可还原出f(x)：

所以，我们只需要选取最大特征根对应的特征向量，即可使f(x)达到最大值。

上面都是关于拉格朗日乘数法的讲解和应用，实际上，如果掌握了这一方法，PCA的推导也将变得十分简单。如果你觉得你还是对拉格朗日乘数法一知半解，我可以在提供一幅维基百科上的插图辅助理解：

如图，我们可以把虚线看作f(x, y)的“等高线”，也就是在位于同一条虚线上，所有x, y的取值组合都会导向相同的f(x, y)值。同时，这个f(x, y)是一个“盆地”，也就是中间低，两边高的架构。而拉格朗日乘数法在做的，就是当x, y满足某种关系g(x, y)=c时，寻找满足条件下的f(x, y)的最大or最小值（这里的图示似乎是一个寻找最小值的例子）。

如上，就是有关拉格朗日乘数法的全部内容，如果你觉得本文章对你有帮助，也请不要忘记给个二连（赞和在看，在看一定要点啊！）。

http://mp.weixin.qq.com/s?__biz=MzU0MzEwOTE2MQ==&mid=2247484975&idx=1&sn=12c57b941e870128fefd5aa8190d0d69

PsychoStatisticia

一个统计学研究者的个人天地

最新文章

聊聊为什么很多留学生的英语水平如此之差

用R语言实现科研数据高效预处理（一）

记录一下读博以来和导师的第一次“吵架”

在课题组里该不该用“师兄师姐”这样的敬称？

统计学是不是一门独立学科？

3分钟快速理解卷积的直观含义

思考鄙视链是突破认知瓶颈的最好方法

主成分分析（PCA）的数学推导

聊聊我对是否应该留在学术圈的一些思考

当统计检验不显著时，为什么要说“无法拒绝零假设”

如何获取优质的知识/信息源

【结构方程模型系列】结构方程模型与线性回归的联系

统计学上的无偏性，一致性以及有效性是什么？

我在荷兰大学的博士第一周

透彻解析拉格朗日乘数法

谈谈我对Ridge回归数学原理的一些新理解

【线性代数】二次型转化的小技巧与应用

12周统计提高班公开招生

【线性代数】直观理解伪逆矩阵

第一期统计学私教课学员反馈

写公众号半年了，来看看我赚了多少钱！

粉丝群入群新规则

贝叶斯与最大似然估计的联系

聊聊我成年后学会的最重要的人生道理

第一本讲义出炉+新粉丝群进群规则

聊聊回国一个多月来最大的感受

假设检验讲义早鸟价最后一天！！！

NBA球星告诉你，统计学中的辛普森悖论到底是什么？

可视化理解固定/随机效应模型

探讨极端值（Outliers）对回归模型的影响

从统计学的角度探讨中国奥运游泳队的服药疑云

985就读的我为什么要休学出国打工度假

聊聊我是如何实现谋生和理想的统一的

【旧文分享】聊聊培根与自我成长

贝叶斯与频数派的根本区别是什么？

发论文不应该成为做科研的主要目的

统计学讲义早鸟价订购+粉丝群新名额

聊一些中国人学习英语可能存在的错误认知

聊一个令我受益终生的学习秘诀/mindset

回国前聊聊在荷比念了两个硕士最大的收获

如何用一句话向外行人解释p值

为什么学好英语可能比数理化更有用

【线性装逼】全网最强奇异值分解证明

【线性天书】从线性代数的角度理解多重共线性的后果

本科生该不该积极参与科研项目？

【可视化理解特征向量】线代老师教不明白的，我来教！

为什么应该坚持阅读英文原文的学术著作

【线性代数】当我们在谈论特征根/特征向量时，我们到底在谈论什么？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉