是否有一种数值稳定的方法来计算大整数 alpha、beta(例如 alpha、beta > 1000000)的beta 分布值?
实际上,我只需要该模式周围的 99% 置信区间,如果这以某种方式使问题变得更容易的话。
补充:对不起,我的问题没有我想象的那么清楚。我想做的是:我有一台机器可以检查传送带上的产品。这些产品中的一部分被机器拒收。现在,如果机器操作员更改了某些检查设置,我想向他/她展示估计的废品率,并暗示当前估计的可靠性。
所以我认为我将实际拒绝率视为随机变量 X,并根据拒绝对象 N 和接受对象 M 的数量计算该随机变量的概率分布。如果我假设 X 的先验分布均匀,这是一个取决于 N 和 M 的 beta 分布。我可以直接向用户显示这个分布,也可以找到一个区间 [l,r] 以便实际的拒绝率在这个区间内,p >= 0.99(使用 shabbychef 的术语)并显示这个间隔。对于较小的M,N(即参数变化后立即),我可以直接计算分布并近似区间[l,r]。但是对于大的 M,N,这种幼稚的方法会导致下溢错误,因为 x^N*(1-x)^M 太小而无法表示为双精度浮点数。
我想我最好的选择是对小的 M,N 使用我的天真 beta 分布,并在 M,N 超过某个阈值时切换到具有相同均值和方差的正态分布。那有意义吗?