为什么相同成像模式的特征描述符之间的性能存在差异?

数据挖掘 特征提取 特征工程
2022-02-20 10:32:00

我一直在使用 GIST、HOG 和 SURF 描述符从不同的胸部 X 射线集合中提取特征,并使用曲线下的准确度和面积来测量性能。这些集合是使用不同的机器,来自不同的医疗机构,并具有不同的像素分辨率获得的。我可以反复看到一个描述符比另一个表现更好,并且这些集合的性能并不相同,尽管它们都是正面胸部 X 光片。尽管它们来自相同的成像模式,但这些集合的性能差异是什么原因造成的?

1个回答

构建和优化 GIST、HOG 等特征提取机制以提高给定数据集的性能。因此,它们在数据集上的表现不佳。这有点像将专用燃料放入不是为了利用它而制造的车辆中——它甚至可能造成伤害。

通常,手工设计的特征很脆弱。我曾经听人说过,机器学习的肮脏秘密就是知道如何将特定领域的信息转化为有意义的特征——之后,你可以使用一个极其简单的分类器,它可能会做得非常好。缺点是您构建的规则非常特定于您的域。

深度神经网络,尤其是卷积神经网络,是一种进步,因为它们可以了解哪些特征对原始数据有用——对于 CNN,这些是原始像素或时间序列值。这些架构不是手动构建特征提取机制,而是自动构建它们。

这样做的一个好处是,如果您通常使用 CNN 来识别图像,您可以在不同的图像识别数据集上重新使用 CNN 的顶部几层特征提取层,并重新训练底部几层来制作网络专门用于识别例如狗的品种。您可以将您对自然图像统计结构的一般知识转移到其他更具体的问题(一般 -> 特定)。在您的情况下,“前几层”类似于您的 GIST/HOG 方法 - 当任务发生变化时,它们不会被期望表现良好,因为它们是为特定任务(特定 -> 其他特定)构建的。