直方图条高度的置信区间

机器算法验证 置信区间 直方图
2022-04-07 11:46:57

是随机变量的独立同分布样本。我将这些绘制在直方图中,并希望包括每个直方图条高度的置信区间。你知道该怎么做吗?X1,X2,,XkX

2个回答

直方图箱。落入特定箱的概率是这只是一个二项式试验(,您要么在垃圾箱中,要么不在垃圾箱中,每个都有给定的概率)。i1,,Ipi

如果您正在计算在 bin 中的频率(,柱状图给出的集合),那么方差应该是pipi(1pi)/k

如果您正在计算总计数,则方差为pi(1pi)×k

然后可以以标准方式形成置信区间。

正如在另一个答案中提出的那样,使用二项式方差仅在比例不接近 0 或 1 时才是一个好主意。p(1p)k

对于表现更好的置信区间,有大量的统计文献,例如 Agresti & Coull (1998)。一些建议的公式在 R 库中实现PropCIs这是一个使用以下方法创建带有误差线的直方图的示例:直方图上的PropCIs误差线