扩展数值数据集的最佳方法是什么

数据挖掘 数据挖掘 数据集 初学者 特征缩放
2022-02-10 21:13:34

我有一个具有不同属性的数据集,它们的值范围不同,当我们需要计算对象之间的距离时,这是一个问题。经过一些研究,我发现我可以使用以下公式进行正则化工作:(value-min)/(max-min) 其中 min 和 max 分别是 val 属性域中的最小值和最大值。问题是,它是否存在其他方式?

感谢您的帮助。

1个回答

您的问题中的术语非常混乱:)。 数据正则化用于模型选择,与数据处理无关。这里以更友好的方式描述。

你的意思是特征缩放它可以通过多种方式完成,包括您描述的方法Rescaling您还可以使用标准化(标准化)和缩放到单位长度。

这些答案可能会有所帮助: