我将如何使用最大的预期效果大小来确定先验?

机器算法验证 贝叶斯 事先的 贝叶斯因子
2022-03-26 10:48:39

我有一个简单的实验,其中约 30 人对 100 个单词做出了回应,其中一半属于 A 型,一半属于 B 型。我使用混合效应线性回归来预测 A 型和B 型。我还使用 ME 逻辑回归来预测准确性差异。这些模型正在使用贝叶斯参数估计进行拟合。

最终,我对确定给定数据的零假设为真的概率感兴趣。我将使用贝叶斯因子来比较具有和不具有感兴趣参数(即单词类型)的模型。

根据文献,我预计 A 型和 B 型之间的最大可能平均差异为 100 毫秒。我预计有可能的效果大小约为 30 毫秒。我应该清楚,如果有效果,这些都是我所期望的。我认为最有可能的期望是完全没有效果。

我很好奇现在如何把它变成以前的。到目前为止,我发现的各种建议是:

  • 使用以零为中心的正态分布,其标准差等于最大预期效应大小的一半
  • 使用以零为中心的正态分布,其标准差等于预期效应大小
  • 在所有可能的效果大小上设置均匀分布

我想知道在根据最大可能效果大小和/或预期效果大小设置先验时是否还有其他经验法则?将先验值居中为零是常见的做法吗?请注意,这一切都是为了计算单词类型影响的贝叶斯因子。

1个回答

设置先验的一个好方法是使用先验预测检查- 基本上你从模型中模拟新数据集。如果模拟数据集在任何方面都不现实,则意味着您的先验存在问题。

先前的预测检查具有将模型的完整结构考虑在内的优点。但是,如果您在模型中只有一种效果或有其他理由相信您可以为每个参数独立设置先验,并且您的界限最小c和最大界限c+比一个好的方法是选择一个家庭,然后为家庭找到这样的参数P(β<c)=P(β>c+)=α在哪里α很小,但不是非常小(0.05往往工作得很好)。

Stan wiki 有更多注意事项: https ://github.com/stan-dev/stan/wiki/Prior-Choice-Recommendations

请注意,恕我直言,先验排除与预期相反方向的影响是错误的。

此外,贝叶斯因子往往对与正常推理无关的先验部分非常敏感(例如,选择N(0,100)对比N(0,1000)当 ML 估计为 0.5 时)。