机器算法验证 - Box-Cox 参数估计是否计入 AIC 的参数？ - 吾爱随笔录

Box-Cox 参数估计是否计入 AIC 的参数？

机器算法验证回归数据转换 aic

2022-04-03 09:43:17

假设我有一个回归模型，例如 2 个参数

$y = ax + b$

但是数据是非正态的，所以在回归之前，我用 Box-Cox 估计变换两边。因此，我也得到了两个 Box-Cox 参数，和。 $\lambda_x$ $\lambda_y$

现在我想计算这个模型的 AIC。有多少个参数？

我的直觉是算作参数，而不是，因为如果将模型应用于从，可以随时从可用估计，但我们必须记住哪个用作我们不知道我们试图预测 $\lambda_y$ $\lambda_x$ $y$ $x$ $\lambda_x$ $x$ $\lambda_y$ $y$

2个回答

为 x 的 Box-Cox 变换写参数 ,。问题中将响应视为随机向量的实现的数据的完整模型描述为 $p_\lambda(x)$ $x$ $\lambda$ $-\infty\lt\lambda\lt\infty$ $(x_i,y_i)$ $(y_i)$ $(Y_i)$

E (p_{λ_{y}} (Y_{i})) = a + b p_{λ_{x}} (x_{i}) .

$\mathbb{E}(p_{\lambda_y}(Y_i)) = a + b\, p_{\lambda_x}(x_i).$

这明确地有四个参数，只要存在至少三个不同的值和三个不同的值，所有这些参数都是可识别的。根据您对前面问题的回答，当没有一个值是独立于数据建立的（因此是根据数据估计的）时，您计算了四个参数。或中的任何一个（或两者）以其他方式建立——例如，如果是从单独的数据集计算的——那么它就不会被计算在内。 ${a, b, p_{\lambda_y}, p_{\lambda_x}}$ $x_i$ $y_i$ $\lambda_x$ $\lambda_y$ $\lambda_y$

（根据对所做的分布假设，拟合模型可能涉及更多参数。对它们进行计数不受 Box-Cox 变换的影响。Box- 的一对一属性Cox 变换表示在没有变换时可识别的任何参数在应用变换时仍可识别。） $p_{\lambda_y}(Y_i)$

为什么要转换数据？

你问问题的尺度是多少？如果不是转换后的比例，则存在参数化问题。

一个例子可能会有所帮助。假设某个响应，并且您想比较两个独立总体进一步假设感兴趣的问题是，“这些人群的均值是否相等？” 在这种情况下，显而易见的事情是分析并估计。 $Y \sim \log N(\mu, \sigma)$ $Y$ $\log y_{ij}$ $\mu_1 - \mu_2$

不过，这并不能回答这个问题。。您需要的是的置信区间。 $E\{Y_i\} = \exp (\mu_i+\sigma_i)$ $\mu_1-\mu_2 + \sigma_1-\sigma_2$

现在，如果您实际上对转换后的规模上的事物感兴趣，那么这些都不适用。它发生了：化学家和环境科学家对 pH 值感兴趣（以至于他们测量的是 pH 值而不是浓度。） $H^+$

其它你可能感兴趣的问题

上一篇预测：1 个月、2 个月、6 个月预测的不同模型？下一篇特征选择：置换测试与删除变量