背景和经验例子
我有两个研究;我进行了一个实验(研究 1),然后复制了它(研究 2)。在研究 1 中,我发现两个变量之间存在交互作用;在研究 2 中,这种交互作用方向相同,但不显着。以下是研究 1 模型的摘要:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.75882 0.26368 21.840 < 2e-16 ***
condSuppression -1.69598 0.34549 -4.909 1.94e-06 ***
prej -0.01981 0.08474 -0.234 0.81542
condSuppression:prej 0.36342 0.11513 3.157 0.00185 **
研究 2 的模型:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.24493 0.24459 21.444 <2e-16 ***
prej 0.13817 0.07984 1.731 0.0851 .
condSuppression -0.59510 0.34168 -1.742 0.0831 .
prej:condSuppression 0.13588 0.11889 1.143 0.2545
我没有说“我想我什么都没有,因为我'复制失败'”,而是结合两个数据集,为数据来自什么研究创建一个虚拟变量,然后运行交互在控制研究虚拟变量后再次。即使在控制它之后,这种交互也是显着的,我发现条件和不喜欢/prej之间的这种双向交互不符合与研究虚拟变量的三向交互。
介绍贝叶斯分析
我有人建议这是使用贝叶斯分析的好机会:在研究 2 中,我有来自研究 1 的信息,我可以将其用作先验信息!通过这种方式,研究 2 正在对研究 1 中的常客、普通最小二乘结果进行贝叶斯更新。所以,我回过头来重新分析研究 2 模型,现在使用系数的信息先验:所有系数都有一个正常先验,其中平均值是研究 1 中的估计值,标准差是研究 1 中的标准误差。
这是结果的摘要:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.63 0.17 5.30 5.52 5.63 5.74 5.96
condSuppression -1.20 0.20 -1.60 -1.34 -1.21 -1.07 -0.80
prej 0.02 0.05 -0.08 -0.01 0.02 0.05 0.11
condSuppression:prej 0.34 0.06 0.21 0.30 0.34 0.38 0.46
sigma 1.14 0.06 1.03 1.10 1.13 1.17 1.26
mean_PPD 5.49 0.11 5.27 5.41 5.49 5.56 5.72
log-posterior -316.40 1.63 -320.25 -317.25 -316.03 -315.23 -314.29
看起来现在我们有相当确凿的证据表明研究 2 分析中的相互作用。这与我简单地将数据堆叠在一起并使用研究编号作为虚拟变量运行模型时所做的一致。
反事实:如果我先进行研究 2 会怎样?
这让我开始思考:如果我先运行研究 2,然后使用研究 1 的数据来更新我对研究 2 的信念会怎样?我做了与上述相同的事情,但相反:我使用常客、普通最小二乘系数估计和研究 2 的标准差作为我对研究 1 数据分析的先验平均值和标准差,重新分析了研究 1 数据。总结的结果是:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.35 0.17 5.01 5.23 5.35 5.46 5.69
condSuppression -1.09 0.20 -1.47 -1.22 -1.09 -0.96 -0.69
prej 0.11 0.05 0.01 0.08 0.11 0.14 0.21
condSuppression:prej 0.17 0.06 0.05 0.13 0.17 0.21 0.28
sigma 1.10 0.06 0.99 1.06 1.09 1.13 1.21
mean_PPD 5.33 0.11 5.11 5.25 5.33 5.40 5.54
log-posterior -303.89 1.61 -307.96 -304.67 -303.53 -302.74 -301.83
同样,我们看到了相互作用的证据,但情况可能不一定如此。请注意,两种贝叶斯分析的点估计值甚至都不在彼此的 95% 可信区间内。贝叶斯分析中的两个可信区间的非重叠比重叠多。
什么是时间优先的贝叶斯证明?
因此,我的问题是:贝叶斯学派尊重数据收集和分析的时间顺序的理由是什么?我从研究 1 中获得结果,并将它们用作研究 2 中的信息先验,以便我使用研究 2 来“更新”我的信念。但是,如果我们假设我得到的结果是从具有真实总体效应的分布中随机抽取的……那我为什么要优先考虑研究 1 的结果呢?使用研究 1 的结果作为研究 2 的先验而不是将研究 2 的结果作为研究 1 的先验的理由是什么?我收集和计算分析的顺序真的很重要吗?在我看来,这似乎不应该——贝叶斯对此的理由是什么?为什么我应该相信点估计值更接近 0.34 而不是 0.17 仅仅因为我首先运行了研究 1?
回应 Kodiologist 的回答
Kodiologist 评论说:
其中第二点指出了您与贝叶斯约定的重要背离。您没有先设置先验,然后以贝叶斯方式拟合两个模型。您以非贝叶斯方式拟合一个模型,然后将其用于另一个模型的先验。如果您使用传统方法,您将不会看到您在此处看到的对顺序的依赖。
为了解决这个问题,我拟合了研究 1 和研究 2 的模型,其中所有回归系数都具有的先验。该变量是实验条件的虚拟变量,编码为0或1;变量以及结果均以 1 到 7 的 7 点量表进行测量。因此,我认为这是一个公平的先验选择。仅根据数据的缩放方式,很少会看到比先前建议的系数大得多的系数。cond
prej
这些估计的平均估计和标准差与 OLS 回归中的大致相同。研究 1:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.756 0.270 5.236 5.573 5.751 5.940 6.289
condSuppression -1.694 0.357 -2.403 -1.925 -1.688 -1.452 -0.986
prej -0.019 0.087 -0.191 -0.079 -0.017 0.040 0.150
condSuppression:prej 0.363 0.119 0.132 0.282 0.360 0.442 0.601
sigma 1.091 0.057 0.987 1.054 1.088 1.126 1.213
mean_PPD 5.332 0.108 5.121 5.259 5.332 5.406 5.542
log-posterior -304.764 1.589 -308.532 -305.551 -304.463 -303.595 -302.625
和研究 2:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.249 0.243 4.783 5.082 5.246 5.417 5.715
condSuppression -0.599 0.342 -1.272 -0.823 -0.599 -0.374 0.098
prej 0.137 0.079 -0.021 0.084 0.138 0.192 0.287
condSuppression:prej 0.135 0.120 -0.099 0.055 0.136 0.214 0.366
sigma 1.132 0.056 1.034 1.092 1.128 1.169 1.253
mean_PPD 5.470 0.114 5.248 5.392 5.471 5.548 5.687
log-posterior -316.699 1.583 -320.626 -317.454 -316.342 -315.561 -314.651
由于这些均值和标准差与 OLS 估计值或多或少相同,因此仍会出现上述顺序效应。如果我在分析研究 2 时将研究 1 的后验汇总统计量插入先验,我观察到的最终后验与首先分析研究 2 然后使用这些后验汇总统计作为分析研究 1 的先验时不同。
即使我使用回归系数的贝叶斯均值和标准差作为先验而不是常客估计,我仍然会观察到相同的顺序效应。所以问题仍然存在:贝叶斯对首先进行的研究给予特权的理由是什么?