新奇检测模型可以过拟合吗?在新颖性检测中,模型在正常数据实例(未被异常值污染)上进行训练,其中在训练过程中不使用标签,同时在包含异常值的数据实例上进行验证和测试。可用于新颖性检测的算法示例是一类 SVM (OCSVM) 和局部异常因子 (LOF)。
新奇检测模型可以过拟合吗?
数据挖掘
机器学习
交叉验证
无监督学习
过拟合
离群值
2021-09-16 10:38:34
1个回答
回答您的问题:是的,根据您选择的超参数,您可能会过度拟合所考虑的正常数据,如果您在正常点和新点之间拟合分离超平面,在输入数据上“形状”太多。例如,在一类支持向量机的情况下,有一些重要的超参数,如 nu 或 gamma:
- nu:有了这个,你告诉 oc-SVM 你想在输入数据中考虑的新点(即异常)的比例;这样,您就不会通过不考虑所有输入数据的正常来过度拟合您的模型(这也取决于您的用例,您希望对输入数据点的正常性有多大把握……)您可以使用scikit-learn 以这种方式打包:
带有 nu=0.1的VS ,您告诉模型将更高比例的点视为异常:
因此,nu 值越低,您就越“过度拟合”您的新奇检测器(这可能更好或更差,具体取决于您对输入数据的了解程度)。
- gamma:现在,看看 gamma 值的影响,这对于过度拟合模型至关重要:
使用 gamma=0.1(和 rbf 内核),您有以下决策面:

VS 伽马 = 10
在哪里,使用最后一个选项,您过度拟合了。
其它你可能感兴趣的问题


