假设我有一个回归模型,例如 2 个参数
但是数据是非正态的,所以在回归之前,我用 Box-Cox 估计变换两边。因此,我也得到了两个 Box-Cox 参数,和。
现在我想计算这个模型的 AIC。有多少个参数?
我的直觉是算作参数,而不是,因为如果将模型应用于从,可以随时从可用估计,但我们必须记住哪个用作我们不知道我们试图预测
假设我有一个回归模型,例如 2 个参数
但是数据是非正态的,所以在回归之前,我用 Box-Cox 估计变换两边。因此,我也得到了两个 Box-Cox 参数,和。
现在我想计算这个模型的 AIC。有多少个参数?
我的直觉是算作参数,而不是,因为如果将模型应用于从,可以随时从可用估计,但我们必须记住哪个用作我们不知道我们试图预测
为 x 的 Box-Cox 变换写参数 ,。问题中将响应视为随机向量的实现的数据的完整模型描述为
这明确地有四个参数,只要存在至少三个不同的值和三个不同的值,所有这些参数都是可识别的。根据您对前面问题的回答,当没有一个值是独立于数据建立的(因此是根据数据估计的)时,您计算了四个参数。或中的任何一个(或两者)以其他方式建立——例如,如果是从单独的数据集计算的——那么它就不会被计算在内。
(根据对所做的分布假设,拟合模型可能涉及更多参数。对它们进行计数不受 Box-Cox 变换的影响。Box- 的一对一属性Cox 变换表示在没有变换时可识别的任何参数在应用变换时仍可识别。)
为什么要转换数据?
你问问题的尺度是多少?如果不是转换后的比例,则存在参数化问题。
一个例子可能会有所帮助。假设某个响应,并且您想比较两个独立总体进一步假设感兴趣的问题是,“这些人群的均值是否相等?” 在这种情况下,显而易见的事情是分析并估计。
不过,这并不能回答这个问题。 。您需要的是的置信区间。
现在,如果您实际上对转换后的规模上的事物感兴趣,那么这些都不适用。它发生了:化学家和环境科学家对 pH 值感兴趣(以至于他们测量的是 pH 值而不是浓度。)