(比如说)95% 置信区间 (CI) 的标准定义只要求它包含真实参数的概率为 95%。显然,这不是唯一的。我所见过的语言表明,在许多有效的 CI 中,找到最短的、对称的或即使某些分布参数未知的情况下也能精确知道等的东西通常是有意义的。换句话说,似乎没有CI比其他“更好”的明显层次结构。
但是,我认为 CI 的一个等效定义是它由所有值组成,这样在看到实现的样本后,真实参数等于该值的零假设不会在适当的显着性水平上被拒绝。这表明只要选择自己喜欢的测试,就可以自动构建 CI。并且基于UMP(或无偏测试中的UMP)概念的测试之间存在标准偏好。
将 CI 定义为对应于 UMP 测试或类似的东西有什么好处吗?