(实)对称矩阵具有一组完整的正交特征向量,其对应的特征值都是实数。对于非对称矩阵,这可能会失败。例如,二维空间中的旋转在实数中没有特征向量或特征值,您必须通过复数传递到向量空间才能找到它们。
如果矩阵是另外正定的,那么这些特征值都是正实数。这个事实比第一个要容易得多,因为如果v是具有单位长度的特征向量,并且λ对应的特征值,那么
λ = λv吨v =v吨A v > 0
其中最后一个等式使用正定性的定义。
这里对直觉的重要性在于线性变换的特征向量和特征值描述了最容易理解变换的坐标系。在像标准坐标系这样的“自然”基础上,线性变换可能很难理解,但每个变换都带有一个“首选”特征向量基础,其中变换充当所有方向的缩放。这使得转换的几何形状更容易理解。
例如,函数局部极值的二阶导数检验R2→ R通常作为一系列神秘条件给出,涉及二阶导数矩阵中的一个条目和一些行列式。事实上,这些条件简单地编码了以下几何观察:
- 如果二阶导数矩阵是正定的,则您处于局部最小值。
- 如果二阶导数矩阵是负定的,则您处于局部最大值。
- 否则,你都不是,一个鞍点。
您可以通过上面的本征基几何推理来理解这一点。临界点的一阶导数消失,因此这里函数的变化率由二阶导数控制。现在我们可以进行几何推理
- 在第一种情况下,有两个特征方向,如果你沿着其中一个方向移动,函数就会增加。
- 在第二个中,两个特征方向,如果你在其中一个方向上移动,函数就会减小。
- 最后,有两个特征方向,但其中一个函数增加,另一个函数减少。
由于特征向量跨越整个空间,任何其他方向都是特征方向的线性组合,因此这些方向的变化率是特征方向变化率的线性组合。所以事实上,这在所有方向上都成立(这或多或少意味着在更高维空间上定义的函数是可微的)。现在,如果您在脑海中画出一张小图,那么对于初学者微积分课本中相当神秘的东西来说,这很有意义。
这直接适用于您的要点之一
二次形式12X⊤一个x -b⊤x + c 是凸的,如果一种是 SPD。凸是一个很好的属性,可以确保本地解决方案是全局解决方案
二阶导数的矩阵是一种处处,是对称正定的。从几何上讲,这意味着如果我们在任何本征方向上移开(因此是任何方向,因为任何其他方向都是本征方向的线性组合),函数本身将在其切平面上方弯曲。这意味着整个表面都是凸的。