我正在为我正在编写的一段代码使用 beta 二项式更新模型。该软件是实时更新的——意味着不断收集数据,在收集到 N 个数据点后,使用 N 个数据点更新贝叶斯模型。
在这个逻辑下,我将后验输出用作下一次迭代的先验。我的问题是,超过数十亿/万亿/也许更多的迭代,贝叶斯 beta 参数(alpha 和 beta)会变得非常大。我担心最终参数会变得如此之大,以至于它们会导致内存中的整数溢出。
所以我的问题是双重的 -
担心这个整数溢出是否合理。我明白那个是一个非常大的数字,但我正在为每年 365 天、每天 24 天、每天 7 天运行的互联网服务构建这个软件,我不希望它崩溃。例如,如果我每天用 1,000,000 个数据点更新它,那么该模型在整数溢出之前只能持续约 4000 天。
是否可以将 x 和 y 非常大的 Beta(x,y) rv 转换为 x* 和 y* 相对较小的 Beta(x*,y*) rv?转换后的 Beta 不必精确,只需相似即可。