数据挖掘 - 确定模型将（可能）错误分类的样本 - 吾爱随笔录

数据挖掘机器学习深度学习神经网络分类特征提取

2021-10-07 02:41:48

问题：

给定一个用于图像分类的神经网络，目标是开发一种算法来确定哪些图像是“有问题的”并且模型可能会对它们进行错误分类。

讨论：

到目前为止，我已经想到了两种可能的方法：

问题：

你能给我提供更多关于第二种方法的建议吗？您认为哪种类型的特征提取有助于区分这些图像？

欢迎任何其他未在此处提及的想法。

3个回答

您可能希望将您的问题描述为不确定性估计问题。

这个想法是您想要评估您的模型在进行预测时的舒适程度。如果您的模型对预测不太满意（即使被归类为 predic_proba = 0.99），那么不确定性预测应该很高。

@BrianSpiering 提出的是一种用神经网络计算不确定性的方法。这种方法被称为蒙特卡洛 Drop Out 作为贝叶斯估计。

这个想法是在进行预测并多次执行时应用丢弃正则化。通过这种方式，您的模型可以预测概率分布，您可以在其中计算多个统计数据作为标准差。这会让你知道你的模型在做这种预测时有多舒服。

这只是一种方法，但有几种方法可以估计不确定性。

有一些博客和论文可能会对您有所帮助：

一种方法是预测期间的蒙特卡洛 dropout。对于同一个样本，模型会在每次随机丢弃连接的同时进行多次预测。此过程估计模型在预测该样本方面的鲁棒性以及哪些连接对于成功预测最重要。这些连接是图像的学习特征。

您可以尝试以下方法：

要做出假设，需要 POC。

其它你可能感兴趣的问题