我有一个随机变量,它以一些未知的概率我想知道分布,并且可以进行多次采样。我需要采样多少次才能获得特定的置信区间?
(例如,99% 的人确信估计的概率在真实概率的 0.01 范围内。)
我有一个随机变量,它以一些未知的概率我想知道分布,并且可以进行多次采样。我需要采样多少次才能获得特定的置信区间?
(例如,99% 的人确信估计的概率在真实概率的 0.01 范围内。)
如果您有一个概率的伯努利变量(0 或 1) ,则其方差为始终小于或等于。独立伯努利变量的平均值趋向于方差的高斯分布,它始终小于或等于。您可以使用高斯变量有 99% 的机会在正负 2.58 标准差范围内这一事实,因此您必须设置上限以使这给您。
因为您的三个结果中的每一个都单独表现为一个伯努利变量,并且因为这是一个全局上限,您也可以将此数字应用于具有三个结果的离散变量。
这样做的贝叶斯方法不会丢失任何信息:
你的变量用概率向量分类分布. 分类分布的共轭先验是狄利克雷分布,所以让用形状参数向量进行狄利克雷分布。每次观察时,您都会通过增加已实现的组件来为中心的半径为 0.01 的球进行积分来检查您的最大似然概率是否在真实概率的 0.01 范围内。