我应该在隔离森林之前将我的特征转换为正常分布吗

数据挖掘 随机森林 异常检测 离群值
2022-02-17 17:55:13

我有一个异常检测问题,我的特征遵循指数分布。我应该先将我的特征转换为正常分布,然后再输入隔离森林吗?

1个回答

最好将数据按原样用于异常检测,因为基础数据不正常。除了你问的以外,隔离森林还有一个问题,就是它有可能产生异常分数不正确的幽灵集群。因此,最近的一个是 EIF 效果更好。