今天说点轻松愉悦的话题,回顾一下大二的线性代数。
封面放上很喜欢的strang先生的线性代数网课截图。
特征值与特征向量是线性代数最重要的内容,它们的几何意义可以从两个角度来理解。
1.矢量相同、坐标系不同的角度
设想有一个矢量空间,为了表示其中的每一个矢量,我们可以选出其中的一组“线性无关”的矢量作为基矢量,然后将空间中每个矢量在这组基矢量方向上的投影叫做“坐标”,这样每个矢量在该组基矢量(代表一个所谓的坐标系)下就获得了一个坐标,我们就可以通过坐标来表示空间中所有矢量了。
但是选择不同的基矢量就有不同的坐标系,对同一个矢量也就有不同的坐标表示。在两组不同的坐标表示之间当然就有一个“坐标变换”
其中A是一个n×n的方阵,可以由矢量的完备性关系得出。
从上式很容易看出,对于两个不同的坐标系,空间中可以有一些特殊的矢量,这些矢量在两个坐标系中的坐标值只相差一个比例因子,这些特殊的矢量就叫做“特征矢量”(就是特征向量),而这些对应的“比例因子”就叫做“特征值”。
2.坐标系相同、矢量不同的角度
如果把同一个矢量在两个不同坐标系下获得的坐标点在同一个坐标系中表示,那么上面的式子就可以看成一种变换,本来有个矢量{x1',x2',...,xn'},现在经过这种“变换”(即乘A矩阵)后变成了另一个矢量{x1,x2,...,xn}。而特征向量就是变换前后矢量方向不变的矢量,虽然方向不变,但是矢量的长度可能发生改变,对应的特征值就代表变换中该方向(特征向量的方向)上矢量长度的缩放比例。
对于任意一个矢量,如果要知道“变换”后对应哪个矢量,只需要先将该矢量在特征向量的方向上分解,因为我们知道特征向量方向上的矢量如何变化(乘以特征值),这样每一个投影矢量的变化就很容易得到,变化后再将特征向量方向上的投影矢量相加,就得到了变换后的矢量。
如果理解了上面这一段,就很容易明白为什么叫做矩阵的“特征”值和“特征”向量了。既然矩阵A代表对矢量的一种变换,而特征值与特征向量又能将这种变换确定下来,那么这些矢量(特征向量)和这些数(特征值)自然能代表矩阵A,它们是矩阵A的特征。
本文完。