在对数正态假设下估计 ANOVA 中细胞均值的比率

机器算法验证 r 方差分析 意思是 sas 对数正态分布
2022-04-17 11:05:54

我正在进行一个双样本测试(1 路方差分析和 2 次处理),目标是假设数据是对数正态的,估计细胞平均值的比率。一种简单的方法是记录响应并拟合模型

logY=b0+b1X

然后估计比率为

R=eb1

但是,这给出了几何单元均值的比率,而不是算术单元均值。

我假设如果我gamlss在 R 或回归PROC GLIMMIX相同的斜率。logY

这很奇怪,因为当我将这种方法与泊松或负二项式回归一起使用时,我确实得到了算术平均值的比率。我错过了什么?


附言

我想我确定了混乱的根源,但我没有解释。具有身份链接功能的对数正态设置是:

logY1N(b0,σ2)

logY2N(b0+b1,σ2)

这意味着

E[Y2]E[Y1]=eb0+b1+σ2/2eb0+σ2/2=eb1

对我来说,这意味着的点估计应该等于原始响应的算术平均值的比率。eb1

另一方面,

E[logY1]=b0

E[logY2]=b0+b1

b0被估计为的算术平均值,被估计为的算术平均值。因此,的点估计值应该等于原始响应的几何均值之比,并且在给定这两个包的输出的情况下确实如此。我在哪里做错了?logY1b0+b1logY2eb1

3个回答

logY=b0+b1X

当您省略错误项时,您会直接陷入原本很容易避免的困难。显然你写的方程是错误的,否则你不需要做估计。两个值足以准确估计两个参数(两个未知数中的两个方程)。你的意思是y

logY=b0+b1X+ε

其中 ... 假设您的 -变量是二进制的。(不知道为什么你需要以这种形式写它,因为只有两组。)εN(0,σ2I)x

但是,这给出了几何单元均值的比率,而不是算术单元均值。

在常数参数的假设下,总体均值的比率将与总体中位数的比率相同(或几何均值,因为中位数和 GM 在对数正态中都是),因为σ2exp(μ)eμ1+σ2/2/eμ2+σ2/2=eμ1/eμ2=eμ1μ2

因此,您可以简单地直接在对数尺度上工作并使用对数平均值的差异,并且当您对结果取幂时,它仍然在估计平均值的比率 - 例如,可以转换间隔. (如果你想要一个无偏估计,你可能需要多花点功夫。)

首先,我很难理解为什么您更喜欢单向方差分析而不是 t 检验,因为您没有寻找交互作用。作为第二点,我会检查方差分析的假设:这可能是两个样本的方差显着不同。最终,在具有对数因变量的线性回归设置中,您的问题可能是由异方差残差引起的,例如在 Stata 13.1/SE 中执行的以下伪造示例: 在此处输入图像描述

算术平均值的两个比率之间的微小差异是由于残差异方差性造成的。顺便提一下,几何平均值的比率为:exp(1.725205)/exp(1.352162)=1.4521468。

记录值的指数算术平均值是原始值的几何平均值。所以当你建模时logY并取幂,你会得到几何平均值。

换句话说E[logY|X]是算术平均值logY, 并取幂得到几何平均值Y. 这延续到系数的解释。

但是,当在 GLM 中使用日志链接功能时,您正在建模log(E[Y|X]), 取幂给你算术平均值Y

至于通过gamlssOR的实际应用GLIMMIX,请确保您提供了正确的参数来准确地建模您想要的东西。