由于您提到稀疏编码,我假设您指的是自然图像。
对于自然图像,通常会进行标准化,因为一旦减去常数部分(并将它们变白;见下文),自然图像块具有相当稳定的统计特性。你可以这样看:一个自然图像有一个平均亮度(块的平均值)和一个对比度(块的标准偏差)。如果您对补丁的内容感兴趣,那么最好减去平均亮度并除以对比度以将所有具有相同内容的图像补丁映射到同一点上。p
自然图像块在减去平均值(通常也称为 DC 分量)后具有相当稳定的统计特性。作为参考,您可以查看 David Field、Bruno Olshausen、David Ruderman、Eero Simoncelli、Matthias Bethge 或 Aapo Hyvaerinen 的论文。有趣的是,DC 分量的统计数据因图像而异(如果您从一张图像中采样许多块),但块的统计特性相当稳定。对于白化补丁尤其如此,即当您除以 PCA 基础中的标准偏差时(白化矩阵不是唯一的,但 PCA 版本是一种可能的选择)。请注意,许多稀疏编码模型实际上是在 DC 减法和白化的自然图像块上训练的。
简而言之:对于自然图像,您喜欢进行标准化,因为适合标准化补丁的概率模型可以更好地在图像之间进行泛化。