聚类不平衡数据集

数据挖掘 机器学习 聚类 异常检测 离群值
2022-03-04 10:34:32

我正在处理的数据有一些非常大的价格值和一些非常小的值。我所做的是首先对数据执行特征装袋并将它们标记为 (0,1),然后对数据以及在上一个任务中找到的标签进行聚类。

这是正确的方法吗?

1个回答

您可以尝试对价格数据进行转换,即 log(price)。通过这样做,非常大的值变得更小。变换后的数据更加“和谐”。