如何将均匀分布的噪声属性添加到数据集中?
机器算法验证
正态分布
异常值
噪音
2022-04-16 00:53:30
1个回答
一种方法是训练一个模型,分别学习每个特征的分布;它可以是每个功能的 KDE。
然后,您可以使用此模型为数据生成异常值。我建议通过从一些特征的平均值生成 4 std 的值来生成异常值,并为其余的生成实际值。这将防止异常值太容易被检测到。
其它你可能感兴趣的问题