我一直在阅读有关特征值和特征向量的信息,但我无法找到任何与它们在图像处理/计算机视觉中的应用相关的体面解释。
例如,这些如何用于人脸检测和眼睛检测?有人可以对此有所了解吗?
我一直在阅读有关特征值和特征向量的信息,但我无法找到任何与它们在图像处理/计算机视觉中的应用相关的体面解释。
例如,这些如何用于人脸检测和眼睛检测?有人可以对此有所了解吗?
我会试着给你一些直觉。
SVD 表示每个矩阵可以分解为 3 个操作 - 旋转、拉伸(缩放)和另一个旋转。
重要的是缩放哪些方向以及如何缩放。
方向是向量(指向某个方向)。
SVD 在线性代数中有很多用途。
它最著名的用途之一是矩阵的低秩逼近。
低等级意味着尝试以较低的自由度表示相同的数据。
它立即为压缩和降维敲响了警钟(SVD 实际上也是Karhunen Loève 压缩的基础)。
考虑将图像分解为的补丁(通常或)。
现在构建这些补丁的矩阵(每个补丁作为一列)。
然后,使用 SVD,您将能够找到该图像的低等级表示,这基本上是一种压缩。
为什么不使用它?
因为这是意义上最有效的压缩,但它使用的基础是自适应图像的。即对于每个压缩图像,您还必须提供损害实际压缩比的基础。
但这就是想法。
这是使用 SVD 的一个很好的想法实现。您可以在Wikipedia
上的精彩文章- Eigen Face (包括代码)中阅读相关内容。
基本上,同样,您可以使用低秩表示来压缩人脸数据库和/或将其用作识别人脸的方法。
SVD 在压缩感知框架中大量使用。
例如,看看名为 - K-SVD的字典学习方法。
关于 SVD 的 Wikipedia 文章确实是开始阅读它的好地方 -奇异值分解(SVD)。
它是主成分分析 (PCA) 中的一个重要组成部分,它允许通过投影此类数据的较少维度来减少维度数量,从而更快地缩小范围以找到模式。
投影操作通过特征人脸特征的加权和来表征个人人脸,因此要识别特定人脸,只需将这些权重与这些人进行比较。
我建议您查看此应用程序的一些示例代码,例如此处。只需将其复制并粘贴到一个文件夹中,以八度音阶读取/运行ex7_pca及其步骤。