我一直在阅读关于异常值检测的 sklearn 文档,甚至是文档提供的示例。一旦我拟合了我的数据集,我所能做的就是将预测函数应用于估计器以找出异常值。但是,我想得到该点是异常值的概率。这可以在sklearn中完成吗?有 R 包来做吗?
我什至不知道sklearn使用的异常值检测方法是否有理论基础,可以让你给出概率。如果不是,那么告诉您什么是异常值和什么不是异常值的标准是什么?它是否考虑概率或某种非概率分数?
任何信息将不胜感激。
编辑
我希望异常值方法考虑数据的多元分布。我认为单变量检测方法相当差。
