如何确定离散和有限随机变量的分布?

机器算法验证 置信区间 离散数据
2022-03-13 22:09:10

我有一个随机变量,它以一些未知的概率我想知道分布,并且可以进行多次采样。我需要采样多少次才能获得特定的置信区间?X{0,1,2}X

(例如,99% 的人确信估计的概率在真实概率的 0.01 范围内。)

2个回答

如果您有一个概率的伯努利变量(0 或 1) ,则其方差为始终小于或等于独立伯努利变量的平均值趋向于方差的高斯分布,它始终小于或等于您可以使用高斯变量有 99% 的机会在正负 2.58 标准差范围内这一事实,因此您必须设置上限以使这给您pp(1p)1/4np(1p)/n1/4n2.58/(2n)<.01n16641

因为您的三个结果中的每一个都单独表现为一个伯努利变量,并且因为这是一个全局上限,您也可以将此数字应用于具有三个结果的离散变量。

这样做的贝叶斯方法不会丢失任何信息:

你的变量X用概率向量分类分布p. 分类分布的共轭先验是狄利克雷分布,所以让p用形状参数向量进行狄利克雷分布。每次观察时,您都会通过增加已实现的组件来为中心的半径为 0.01 的球进行积分来检查您的最大似然概率是否在真实概率的 0.01 范围内。ϕϕpp