Bias 和 overfilling 和 underfitting 有什么区别?

数据挖掘 机器学习 统计数据 数据科学模型 统计模型
2022-03-06 05:48:03

我对偏差和过度拟合感到困惑,因为我认为这听起来很相似但无法解释差异?

1个回答

好吧,我无法表达足够多的关于偏差方差、过拟合和欠拟合的文章和问题。

但让我也试着用简单的话为你解释一下。

“偏见”作为一个词意味着 - 偏爱一件事胜过另一件事。就像我们听说亚马逊的 Alexa 不响应女性的声音/命令一样。所以偏向于男性。

现在,如果想要制作一个能够预测看不见的数据的模型,我根本不希望它有偏见,就像我不希望这个系统偏爱男性的声音而不是女性的声音一样。如果它有偏见,它本质上是给我一个错误。它对我的目标功能(在这里接受语音命令)做出了更多假设。

现在,由于它假设很多并且给了我一个错误,它相当欠拟合。但是实际上它不仅是高偏差,而且+低方差会导致拟合不足,但我暂时将方差放在一边。现在,高偏差和低方差可能有很多原因。我不会详细说明训练/测试规模的原因。

现在,如果我的模型能够在给定的测试数据上正确预测数据,这是一个好消息,这意味着没有错误,这意味着偏差更少。然而,它可能没有给我任何错误,因为它很好地学习了“训练”数据,捕捉了每一个场景/噪音。现在又是方差,这里有高方差,再加上低偏差会导致过度拟合。这意味着它能够很好地预测我给它训练的数据,但是如果我给它提供新数据,它将无法正确预测它,即泛化。

现在您可能还想了解方差。再次理解方差的简单字典含义——即“不同、分歧或不一致的事实或性质”。现在将这个定义与目标函数联系起来。

请注意,这是一个非常模糊的解释,您可以遵循,并且我建议您遵循该概念的标准定义。

现在有更好的解释 - https://machinelearningmastery.com/gentle-introduction-to-the-bias-variance-trade-off-in-machine-learning/ https://stats.stackexchange.com/questions/4284 /直觉解释偏差方差权衡

这是一篇好论文-

http://www.cems.uwe.ac.uk/~irjohnso/coursenotes/uqc832/tr-bias.pdf

最精确的可视化如下 -

在此处输入图像描述