Box-Cox 参数估计是否计入 AIC 的参数?

机器算法验证 回归 数据转换 aic
2022-04-03 09:43:17

假设我有一个回归模型,例如 2 个参数

y=ax+b

但是数据是非正态的,所以在回归之前,我用 Box-Cox 估计变换两边。因此,我也得到了两个 Box-Cox 参数,λxλy

现在我想计算这个模型的 AIC。有多少个参数?

我的直觉是算作参数,而不是,因为如果将模型应用于可以随时从可用估计,但我们必须记住哪个用作我们不知道我们试图预测λyλxyxλxxλyy

2个回答

为 x 的 Box-Cox 变换参数 ,问题中将响应视为随机向量的实现的数据完整模型描述为pλ(x)xλ<λ<(xi,yi)(yi)(Yi)

E(pλy(Yi))=a+bpλx(xi).

这明确地有四个参数,只要存在至少三个不同的值和三个不同的值,所有这些参数都是可识别的。根据您对前面问题的回答,当没有一个值是独立于数据建立的(因此是根据数据估计的)时,您计算了四个参数。中的任何一个(或两者)以其他方式建立——例如,如果是从单独的数据集计算的——那么它就不会被计算在内。a,b,pλy,pλxxiyiλxλyλy

(根据对所做的分布假设,拟合模型可能涉及更多参数。对它们进行计数不受 Box-Cox 变换的影响。Box- 的一对一属性Cox 变换表示在没有变换时可识别的任何参数在应用变换时仍可识别。)pλy(Yi)

为什么要转换数据?

你问问题的尺度是多少?如果不是转换后的比例,则存在参数化问题。

一个例子可能会有所帮助。假设某个响应,并且您想比较两个独立总体进一步假设感兴趣的问题是,“这些人群的均值是否相等?” 在这种情况下,显而易见的事情是分析并估计YlogN(μ,σ)Ylogyijμ1μ2

不过,这并不能回答这个问题。 您需要的是的置信区间。E{Yi}=exp(μi+σi)μ1μ2+σ1σ2

现在,如果您实际上对转换后的规模上的事物感兴趣,那么这些都不适用。它发生了:化学家和环境科学家对 pH 值感兴趣(以至于他们测量的是 pH 值而不是浓度。)H+