背景
我通常对学习使用数据来指定先验的适当方法感兴趣。上一个问题询问如何从专家那里获得先验知识,并获得了一些很好的建议。在这里,我有兴趣学习如何指定使用数据的先验。我计划在荟萃分析中使用这些先验来综合我收集的其他数据。
更新 虽然约翰提供了一个“正确”的答案,但就我而言,它需要对原始模型进行大量修改才能实现,所以我更愿意找到一种方法来估计先验作为离散步骤。
问题
指定事先通知的此类数据的最佳方法是什么?
如果我正在使用特定物种(猴子)的参数,并且该物种属于一组生物体(灵长类动物),并且数据可用于灵长类动物但不适用于猴子,是否适合基于灵长类动物的分布数据?
示例案例,首先是建议的解决方案
我对 100 种灵长类拇指长度的灵长类动物进行了 100 次观察:
set.seed(0) thumb <- rgamma(100, 4, 0.1) library(MASS) fitdistr(thumb, 'gamma')
实际上,当没有先验理由选择特定分布时,可以通过最大似然选择分布:
for(dist in c('gamma', 'lognormal', 'weibull') { logLik(fitdistr(thumb, dist)) }
我收集了来自 50 种不同灵长类动物的 50 种平均值、标准误差和样本大小,以及来自另外 50 种眼睛直径的 50 次独立观察结果:
eye <- data.frame( diameter = rgamma(100, 4, 0.1), se = c(rlnorm(50, 0.5,1), rep(NA, 50)), n = c(rep(1:5, 10), rep(1, 50))) eye <- signif(eye, 3)
如何将样本统计数据纳入我的先验计算中?