我最近发现有些情况我们不能使用比较两个回归模型之间的拟合优度。
让
是两个回归。我想通过查看它们来比较这两者. 乍一看,我以为自从向我们解释了解释的变异与总变异的接近程度,这可能是比较模型的好方法。但由于某种原因我不能使用在这种情况下,因为他们的“ESS”不同。我不明白为什么这是一个原因。
我最近发现有些情况我们不能使用比较两个回归模型之间的拟合优度。
让
是两个回归。我想通过查看它们来比较这两者. 乍一看,我以为自从向我们解释了解释的变异与总变异的接近程度,这可能是比较模型的好方法。但由于某种原因我不能使用在这种情况下,因为他们的“ESS”不同。我不明白为什么这是一个原因。
是残差;第二个模型也应该有残差吗?
选择是否对响应变量进行对数转换应基于您期望的解释变量和响应变量之间的关系类型。解释方差 () 可以是低的或高的,尽管关系是对数的。
关于 R 平方
不是模型选择标准,因为它没有考虑模型使用的自由度(即参数的数量)。但是,由于这些模型具有相同数量的参数,因此这不是问题。更重要的是它们描述了完全不同的东西:
乍一看,我以为自从向我们解释解释的变异与总变异的接近程度
这是真实的,是模型解释的响应变量的方差量。但是,那第一个模型描述了解释的方差,这与第二个模型不同()。这可能就是您发现无法以这种方式比较它们的原因:您问题中的 ESS 是Explained Sum of Squares。
如果仅有的两个选择是对数变换或因变量不变换,那么要在平等的基础上获得 AIC 值并允许进行比较,可以对未变换的因变量和对数变换的因变量执行线性回归因变量乘以几何平均值。
首先(在此示例中使用 R)生成一些具有因变量日志中线性模型的数据:
set.seed(12345)
x = c(1:10)
y = exp(1 + 0.2*x + 0.2*rnorm(10))
拟合线性回归给定:
lm.y = lm(y ~ x)
AIC(lm.y)
# 41.72051
现在拟合几何平均乘以对数的线性回归给定:
lm.logy = lm(I(mean(log(y))*log(y)) ~ x)
AIC(lm.logy)
# 9.189641
AIC 值的差异约为 32,这表明采用日志会产生更好的模型。(不一定是好模型,而是更好的模型。)
如果转换的选择是基于某个未知的幂(而不仅仅是“知道”对数转换或不转换是仅有的两个选项),那么应该与回归参数同时估计该幂。请参见Box-Cox 变换。