在 ISL 中,偏差-方差权衡的概念是根据经验法则提出的,即简单模型将具有高偏差,而复杂模型将具有高方差。
鉴于这个想法,我认为线性回归会有很大的偏差,因为它是一个简单的模型,内置了一个巨大的假设(数据是线性的);但是,我也知道 OLS 是一个无偏估计量。
我如何调和这两个事实?
在 ISL 中,偏差-方差权衡的概念是根据经验法则提出的,即简单模型将具有高偏差,而复杂模型将具有高方差。
鉴于这个想法,我认为线性回归会有很大的偏差,因为它是一个简单的模型,内置了一个巨大的假设(数据是线性的);但是,我也知道 OLS 是一个无偏估计量。
我如何调和这两个事实?
OLS 是假设模型为真的无偏估计量,也就是说,
和其他小模型的不足之处。请参阅我在为什么不相关的回归量在大样本中变得具有统计显着性?. 偏差方差分解是(来自 ESL 的第 7.3 节,第二版)
线性回归是一个通用术语。使用时, 首先想到的是也是线性回归,即和。只是我们使用多项式特征。数据(目标)可以是抛物线性质的,但如果您使用多项式特征,它仍然可以通过线性回归进行估计。当您使用与数据相比过于简单的模型时,就会出现高偏差;不是特别是当您使用模型时。
无偏估计器是一个稍微不同的概念。如果一个估计量,比如 变量是无偏的,那么我们有。一个非常简单的无偏估计量是均值;它也是无偏的,因为如果那么它的期望值将等于平均值: . 因此,更不用说 OLS,仅使用均值是一种无偏估计技术。因此,拥有无偏估计器并不意味着您的估计器非常适合您的数据。