这些等价的表示是相同的分层贝叶斯模型吗?

机器算法验证 造型 贝叶斯 多层次分析
2022-03-23 00:31:16

如果是一个分类变量,并且我对 \beta_1 的后验分布,其中是一个系数向量,每个 X 级别一个,这些是等效模型吗?Xβ1β1

模型 1:

Y(β0+β1X1,σ2)
β1N(0,τ)

模型2:

Y(β1X1,σ2)
β1N(β0,τ)

在这两个模型中,有一个知情先验,有一个弱先验: β0τ

β0Gamma(6,3)
τGamma(0.1,0.1)

如果这些不相等,为什么不呢?

我问是因为虽然我认为这些是相同的,但是当在 JAGS 中实现时,来自第一个模型的的 MCMC 链比第二个模型具有更高的自相关性。β0


我(最初)将我的 R 代码放在这里SO.test.tgz,但它不再可用。我道歉 ...

4个回答

更新回复: 您仍然没有模型 #2 的完整规格。但是,我可以猜到你的意思——如果我错了,请纠正我。问题是陈述 &不是概率性的。 Y=β1XY=β0+β1X

[旁白:在数学意义上,您正在定义一组线性方程。如果您只有一个数据点,那么您可以求解以获得满足该方程的唯一值。如果您有多个的值,那么这表示一个过度约束的系统——没有解决方案。]Y=β1Xβ1YX1

我的预感是你的意思是:的某个值- (或者你也想估计它)。这会将您的随机效应模型置于标准线性混合效应模型的上下文中。

YN(β1X1,σ2)
σ2

如果我们假设像我所说的那样分布,那么:Y

答:不,它们不相等。在第一个模型中,本质上是一个截距(想象将乘以 ,其中始终等于 1)。在第二个模型中,的随机偏移量请注意,这个模型(#2)对于不做贝叶斯的人来说没有意义......这与运行线性回归相同,其中你有两个完全多重共线的预测变量,但因为你已经在贝叶斯模型中做了分布假设,你可以估计它。也就是说,我不确定你应该这样做。β0β0X0X0β0β1

注意:您可以在不添加分布假设的情况下运行第一个模型(我在上面为模型 #2 包括了更多)。但是,我从未见过这种规范。我认为这与声明相同。换句话说,作为伽马随机变量分布的误差项。我的预感是您需要一个随机截距模型(具有正态分布的误差)。如果是这种情况,请使用模型 #1,不要使用模型 #2。将表现出自相关,直到你标准化你的分类变量的水平 - 确保所有个体的总和等于零(你可以通过减去平均值来做到这一点(Yβ1X1)Gamma(6,3)β0β1X1的每一次观察)。X1

两个模型中唯一的相似之处是它们所属的模型的一般类型,否则它们在一般情况下并不像 M. Tibbit 所指出的那样相似。

这两个模型都属于具有不同斜率的层次模型类(参见Gelman 和 Hill 2006进行详细处理)

“为什么不”的答案有很多,M. Tibbits 指出了其中之一。还有一些是:

  • 在模型 2 中,平均斜率为 6/3,而模型 1 的斜率为 0。(如果我们有数据,这个描述可以做得更好,但鉴于描述有限,它“几乎”准确)

  • 您会期望模型 1 中的数据沿着近似水平的线随机分布,而在模型 2 中,您会期望数据沿着大约斜率的线随机分布。beta_0 和截距。

如果您根据分层设置模拟数据并查看分析结果,则可以最好地验证这些答案。

谢谢,

S。

您已经有了很好的答案并且已经接受了一个,但我不确定是否有人说得足够清楚,甚至我也能直觉。您的两个模型的核心是:

[1]Y=β0+β1X1+ϵ

[2]Y=(β0+β1)X1+ϵ=β0X1+β1X1+ϵ

是的β'沙ϵ) 在您的示例中有分布,但在我看来,这只会抹掉值并且不会改变公式的形式。有鉴于此,它们显然是不同的:您的第二个模型基本上修复了截距β0=0然后做斜坡β1有点复杂。

如果x1=0, 然后Y~(β0,σ2)在模型 1 和Y~(0,σ2)在模型 2 中。

如果x1=1, 然后Y~(β0+β1,σ2)在模型 1 和Y~(β1,σ2)在模型 2 中。

看看第一行的例子:是β0一个随机变量还是一个零常数?