带有噪声目标变量的回归

数据挖掘 机器学习 深度学习 回归 支持向量机 监督学习
2022-03-16 01:23:22

如何处理输入数据没有噪声但目标变量有噪声的回归问题?是否有任何回归算法对嘈杂的目标变量具有鲁棒性?

另外,是否有可能以某种方式对目标变量进行去噪?如果是这样,怎么做?

1个回答

这取决于噪音的大小:

  • 如果它只是一点点噪音,例如 2% 的目标值偏离了一个小值,那么您可以放心地忽略它,因为回归方法无论如何都会依赖于最频繁的模式。
  • 如果有很多噪声,比如 50% 的目标值是完全随机的,那么除非你能检测并移除噪声实例,否则你可以忘记它:数据集是无用的。

一般来说,机器学习算法是基于统计原理的,在某种程度上,它们的工作是避免噪声并专注于规则模式。但是有两点需要注意:

  • 噪声真的是随机的,还是会在数据中引入一些偏差?后者是一个更严重的问题。
  • 嘈杂的数据更有可能导致过度拟合,因此应采取额外的预防措施:根据数据,可能需要减少特征的数量和/或模型的复杂性。