数据挖掘 - 如何使用给定机器学习模型的偏差和方差计算不可约误差？ - 吾爱随笔录

我正在尝试计算 ML 模型的偏差和方差。

E r r (x) = E [(Y - \hat{f} (x))^{2}] E r r (x) = B i a s^{2} + V a r i a n c e + I r r e d u c i b l e E r r o r

$Err(x)=E[(Y−\hat f(x))^2] \\Err(x)=Bias^2+Variance+Irreducible\ Error$

\hat{f} (x)

$\hat f(x)$ 是我们的模型

$Y$ 是我们试图预测的变量

$Err(x)$ 是总体误差 (MSE)。

我正在将mlxtend 库用于bias variance decomposition.

我遵循的步骤：

生成训练数据集 $Y = f(x) + \epsilon$

$f(x) = a + bx + cx^2$

$\epsilon ∼N(0,σ^2) .$ 是正态分布的噪声，均值 $0$ ，方差 $\sigma^2$
$f(x) = a + bx + cx^2$ 生成测试数据集。这里我创建了 X_test 和 y_test。y_test 包含真值（无噪声），因为偏差是使用真函数计算的。
使用 mlxtend 库函数计算偏差和方差。在这里，我将线性回归估计器传递给函数。

我的问题是即使这里的 MSE 公式是 $Err(x)=Bias^2+Variance+Irreducible\ Error$ 并且我还读到如果我们的模型是在包含噪声的数据上训练的，那么就不可能从估计器。尽管如此，分解后我得到 $Irreducible\ Error = 0$ 。即使我使用真正的函数（ $f(x)$ ）来计算 $Bias$ ，仍然 $Irreducible\ Error$ 是 $0$ 。

我究竟做错了什么？

根据我的理解，如果我计算 $Err(x)$ 、 $Bias^2$ 和 $Variance$ 我应该能够从上面的方程中得到 $Irreducible\ Error$