我想知道是否有人可以向我解释 Clopper-Pearson CI 对比例的直觉。
据我所知,每个 CI 都包含一个方差。但是,对于比例,即使我的比例是 0 或 1(0% 或 100%),也可以计算出 Clopper-Pearson CI。我尝试查看公式,并且我知道它与二项式分布的百分位数有关,并且我知道找到 CI 涉及迭代,但我想知道是否有人可以用“简单的话”或最少的数学来解释逻辑和理性?
我想知道是否有人可以向我解释 Clopper-Pearson CI 对比例的直觉。
据我所知,每个 CI 都包含一个方差。但是,对于比例,即使我的比例是 0 或 1(0% 或 100%),也可以计算出 Clopper-Pearson CI。我尝试查看公式,并且我知道它与二项式分布的百分位数有关,并且我知道找到 CI 涉及迭代,但我想知道是否有人可以用“简单的话”或最少的数学来解释逻辑和理性?
当您说您习惯于包含方差表达式的置信区间时,您是在考虑高斯情况,其中关于表征总体的两个参数的信息(一个是平均值,另一个是方差)由样本汇总均值和样本方差。样本均值估计总体均值,但其精度取决于总体方差,而总体方差又由样本方差估计。另一方面,二项分布只有一个参数——每次试验的成功概率——样本给出的关于这个参数的所有信息都汇总在总数中。在如此多的独立试验中取得成功。总体方差和均值均由该参数确定。
对于直接使用二项式概率质量函数,您可以获得 Clopper-Pearson 95%(比方说)置信区间。假设您次试验次成功。pmf 是
增加直到或更少成功的概率下降到 2.5%:这是你的上限。减小直到或更多成功的概率降至 2.5%:这是你的下限。(如果从阅读中不清楚,我建议你实际上尝试这样做。)你在这里所做的是找到的值,当它作为零假设时会导致它(仅)被拒绝显着性水平为 5% 的双尾检验。从长远来看,以这种方式计算的界限至少在 95% 的情况下