给定 log z 的估计量,获得 z 的估计量

机器算法验证 回归 广义线性模型 线性模型
2022-03-17 01:31:11

根据 Gung 在Getting the equation from R's lm when using a product中的建议,我正在为这个问题开始一个新线程。

我有一个模型用于随机变量和系数logz^=a+bx+cy+dxyx,y,za,b,c,d

我现在想要一个而不是的模型。我打算简单地做但我已被警告不要这样做。为什么这是不正确的,正确的方法是什么(如果有的话)?zlogzz^=exp(a+bx+cy+dxy)

1个回答

我不一定对你对你的预测值求幂有问题。你只需要意识到,如果前者是一种期望,那么结果就不再是一种期望。中每个点的期望值)。期望值是所有可能值的加权平均值,其中权重是可能性。简而言之,它是条件均值。因为变量的对数/取幂是非线性变换,所以如果您输入一个均值,您就不会得到一个均值作为输出。 YXE(Y|X=xi)Y

通常,人们使用对数变换来归一化残差分布和/或稳定方差。那很好。但是,如果得到的分布是正态的(ish),具有(足够)恒定的方差,那么原始分布必然不是。当您进行反向变换时,您会得到条件中位数而不是条件均值如果你理解这一点(以及它所暗示的),并且你想要那样,你会没事的。

考虑:

x   = c(2, 3, 1, 9, 3, 5, 9, 3)
lx  = log(x)
mlx = mean(lx)
mlx
# [1] 1.249109
exp(mlx)
# [1] 3.487234
mean(x)
# [1] 4.375