我正在阅读统计学家 William Briggs 的一篇博文,至少可以说,下面的说法让我很感兴趣。
你怎么看?
什么是置信区间?当然,这是一个等式,它将为您的数据提供一个区间。它旨在提供参数估计的不确定性的度量。现在,严格按照频率论理论——我们甚至可以假设它是正确的——关于你手头的 CI,你唯一能说的就是参数的真实值存在于其中或不存在。这是一个重言式,因此它总是正确的。因此,CI 根本没有提供不确定性的度量:事实上,计算一个无用的练习。
我正在阅读统计学家 William Briggs 的一篇博文,至少可以说,下面的说法让我很感兴趣。
你怎么看?
什么是置信区间?当然,这是一个等式,它将为您的数据提供一个区间。它旨在提供参数估计的不确定性的度量。现在,严格按照频率论理论——我们甚至可以假设它是正确的——关于你手头的 CI,你唯一能说的就是参数的真实值存在于其中或不存在。这是一个重言式,因此它总是正确的。因此,CI 根本没有提供不确定性的度量:事实上,计算一个无用的练习。
他相当笨拙地指的是众所周知的事实,即频率分析不会用概率分布模拟我们对未知参数的知识状态,因此计算了(比如 95%)置信区间(比如 1.2 到 3.4)来自某些数据的总体参数(例如高斯分布的平均值),然后您无法继续并声称平均值有 95% 的概率落在 1.2 和 3.4 之间。概率是一或零——你不知道是哪个。但是,一般来说,您可以说的是,您计算 95% 置信区间的过程是确保它们在 95% 的时间内包含真实参数值的过程。这似乎足以说明 CI 反映了不确定性。正如大卫考克斯爵士所说†
我们定义了评估证据的程序,这些程序根据它们在重复使用时的表现进行校准。从这个意义上说,它们与其他测量仪器没有区别。
您可以说的其他内容根据您用于计算置信区间的特定方法而有所不同;如果您确保在给定数据的情况下,内部的值比外部的点更有可能,那么您可以这样说(对于常用方法,它通常近似正确)。请参阅此处了解更多信息。
† Cox (2006),统计推断原理,§1.5.2
用数学方法描述不确定性可能很困难,但当我看到它时我就知道了;它通常有很宽的 95% 置信区间。