如何参数化两个正态分布变量的比率,或一个的倒数?

机器算法验证 分布 贝叶斯 方差 随机变量 荟萃分析
2022-03-05 09:26:11

问题: 我正在参数化分布以用作贝叶斯元分析中的先验和数据。这些数据在文献中作为汇总统计数据提供,几乎完全假设为正态分布(尽管没有一个变量可以 < 0,有些是比率,有些是质量等)。

我遇到了两个我没有解决方案的案例。有时,感兴趣的参数是数据的倒数或两个变量的比率。

例子:

  1. 两个正态分布变量的比率:
    • 数据:氮百分比和碳百分比的平均值和标准差
    • 参数:碳氮比。
  2. 正态分布变量的倒数:
    • 数据:质量/面积
    • 参数:面积/质量

我目前的方法是使用模拟:

例如,对于一组碳和氮百分比数据,平均值:xbar.n,c,方差:se.n,c,样本量:nn,nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

我想参数化 ratio.cn = perc.c/perc.n

# parameter of interest
ratio.cn <- perc.c / perc.n

然后为我的先前的最佳拟合分布0

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

问题: 这是一种有效的方法吗?还有其他/更好的方法吗?

提前致谢!

更新:柯西分布,定义为两个正态与的比率,由于我想估计方差,因此效用有限。也许我可以计算从柯西绘制的 n 次模拟的方差?μ=0

我确实找到了以下封闭形式的近似值,但我没有测试它们是否给出相同的结果... Hayya et al, 1975

μ^y:x=μy/mux+σx2μy/μx3+cov(x,y)σx2σy2/μx2
σ^y:x2=σx2×μy/mux4+σy2/mux22cov(x,y)σx2σy2/mux3

Hayya, J. 和 Armstrong, D. 和 Gressis, N.,1975 年。关于两个正态分布变量的比率的注释。管理科学21:1338--1341

2个回答

您可能想查看有关比率分布的 Wikipedia 文章下的一些参考资料。您可能会找到更好的近似值或分布来使用。否则,您的方法似乎是合理的。

更新我认为更好的参考可能是:

请参见第 195 页的公式 2-4。

更新 2

关于您关于柯西差异的更新问题 - 正如约翰库克在评论中指出的那样,差异不存在。因此,采用样本方差根本无法作为“估计器”。事实上,您会发现您的样本方差根本不收敛,并且随着您不断采样而剧烈波动。

你能不能假设是正态随机变量的倒数,并在确定正态分布的适当参数后进行必要的贝叶斯计算。y1N(.,.)

正如 ars 和 John 在评论中指出的那样,我在下面使用 Cauchy 的建议不起作用。

两个正态随机变量的比率服从柯西分布。您可能希望使用这个想法来识别最接近您拥有的数据的柯西参数。