问题: 我正在参数化分布以用作贝叶斯元分析中的先验和数据。这些数据在文献中作为汇总统计数据提供,几乎完全假设为正态分布(尽管没有一个变量可以 < 0,有些是比率,有些是质量等)。
我遇到了两个我没有解决方案的案例。有时,感兴趣的参数是数据的倒数或两个变量的比率。
例子:
- 两个正态分布变量的比率:
- 数据:氮百分比和碳百分比的平均值和标准差
- 参数:碳氮比。
- 正态分布变量的倒数:
- 数据:质量/面积
- 参数:面积/质量
我目前的方法是使用模拟:
例如,对于一组碳和氮百分比数据,平均值:xbar.n,c,方差:se.n,c,样本量:nn,nc:
set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N
我想参数化 ratio.cn = perc.c/perc.n
# parameter of interest
ratio.cn <- perc.c / perc.n
然后为我的先前的最佳拟合分布
library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}
问题: 这是一种有效的方法吗?还有其他/更好的方法吗?
提前致谢!
更新:柯西分布,定义为两个正态与的比率,由于我想估计方差,因此效用有限。也许我可以计算从柯西绘制的 n 次模拟的方差?
我确实找到了以下封闭形式的近似值,但我没有测试它们是否给出相同的结果... Hayya et al, 1975
Hayya, J. 和 Armstrong, D. 和 Gressis, N.,1975 年。关于两个正态分布变量的比率的注释。管理科学21:1338--1341