负置信区间的解释

机器算法验证 置信区间 解释 标准错误 可信区间
2022-04-01 15:09:29

假设我从我的家庭农场测量了 50 只鸡的重量,该农场饲养了 1000 只鸡。样本均值为 5 kg,SEM 为 ± 3 kg,95% 置信区间为 5 ± 3 * 1.96 = -0.88 kg 至 10.88 kg。我应该如何解释 SEM 和 CI 的结果。显然,一只鸡的重量不应该是负数。

  1. 在我看来,SEM 除了计算 CI 之外几乎没有什么用处?我们可以从 SEM 中获得哪些定量信息?我们可以说 1000 只鸡的真实平均体重很可能(非常定性)在 2 公斤到 8 公斤之间(样本平均值 ± SEM),但我们知道概率吗?
  2. 如何解释 CI 的负下限?
  3. 真实平均体重落在 0 kg - 10.88 kg 范围内的概率有多大?
4个回答

你做了什么 - 你在假设鸡的重量是从正常分布(具有值范围)中得出的置信区间 - 事实上,这些可以从其他支持的分布中得出,例如erlangchi分布,但是当样本量时,我们可以假设均值具有正态分布 - 所以这个值(,)R+>500.88是该假设的影响,因此您可以将其解释为 0 ...但是要以严格的数学方式进行,您应该找到鸡重量的真实分布,然后构造适当的置信区间(这将不同于正态分布),然后你会有更准确的估计,你会得出=更有意义的结论,

但请记住,您将得出的结论将是关于您已经拥有的 1000 个观察样本的结论!

我只会(首先)在对数尺度上工作,然后对在该尺度上获得的置信限进行反向转换。这样,您就可以确定积极的限制。

对此进行全面的贝叶斯是一个具有广泛吸引力的答案,但是当您提出这个问题时,我不清楚“学习一种全新的统计方法”可能对您立即实用。

所有置信限充其量都是聪明的猜测。但很明显,负的下限在生物学上是荒谬的,所以你有责任尽可能避免这种情况。我不同意那些说“只取零”的人。如果该技术产生荒谬的结果,则该技术是不合适的。

更一般地说,数据对称分布的尺度会产生比你引用的更合理的结果。在某些情况下,平方根或立方根刻度可能比对数刻度更有效。

其中一些建议取决于从字面上理解你的例子。不言自明的是,首先使用对数可以保证产生正的上限和下限。

(我认为这个答案与考虑使用具有适当家庭和非身份链接的广义线性模型的建议一致。)

PS 为什么不引导 CI?

在我看来,SEM 除了计算 CI 之外几乎没有什么用处?我们可以从 SEM 中获得哪些定量信息?我们可以说 1000 只鸡的真实平均体重很可能(非常定性)在 2 公斤到 8 公斤之间(样本平均值 ± SEM),但我们知道概率吗?

让我们从一个观察开始。SEM不是描述性统计数据。它来源于数据。它会告知您统计数据的抽样误差,但不会告知总体的不确定性。它是测量过程的产物。

如果您选择了不同的测量值,例如中位数,您将有不同的标准误差。同样,如果你的模型不同,你会有不同的标准误差。

有无数种可能的置信区间函数。您正在使用教科书中的标准版本,但它不是唯一的。这是一个具有理想属性的模型,因此它被教导,但如果您选择正式模拟您从获得不良样本中获得的损失,则可能会有不同的间隔。

SEM 提供特定于样品的信息。就您的问题而言,它的唯一用途是作为计算中的临时步骤。

置信区间告诉您对平均值(或其他一些统计数据)位置有信心的区域。置信区间没有告诉你鸡本身大小的分布。

您可能想要的间隔是容差间隔。 如果您想知道 95% 的鸡群可能下降的范围,那么您需要 95% 的容差区间而不是 95% 的置信区间。

如何解释 CI 的负下限?

置信区间的界限没有解释。它们是随机数。生成区间的函数是 % 置信区间,如果在无限重复时,该区间将覆盖参数的真实值至少 % 的时间。αα

如果你创建一个百分比置信区间并且它是那么解释是如果你表现得好像真实值在那个范围内那么你会被愚弄不到百分比的时间一旦重复变得非常大。α[a,b]α

负界限很好。假设我们是大自然母亲,你知道真实的人口平均体重是 4 公斤。您应该很高兴,因为区间包含实际值。下限确实是无意义的,但频率论方法允许无意义的答案,只要它在一定百分比的时间内覆盖了真实值。[.88,10.88]

另外,请注意,窄间隔并不比更宽的间隔更好。窄的并不比宽的更准确。它们同样精确,因为它们在大量重复时至少在固定百分比的时间内覆盖了真实值。

要了解原因,假设您将鸡群随机分成两半并称重。一半鸡的间隔比另一半小。随机化过程如何使一组更准确?没有什么。

真实平均体重落在 0 kg - 10.88 kg 范围内的概率有多大?

这是一个特定于模型的问题。我会担心您的数据不是正态分布的。虽然它们可能是正态分布的,但考虑到大致相同的年龄和饮食,人口中包含小鸡和非常老的鸡。我会惊讶地发现它们通常是在不受控制的基础上分布的。

但是,如果我们假设鸡彼此足够相似以达到正态分布,那么我们就可以开始解决您的问题了。

首先,置信区间不是概率的陈述。如果你想要一个概率,那么你将需要使用贝叶斯模型。贝叶斯可信区间将告诉您参数在某个范围内的概率。频率论方法不会这样做。

原因是在频率论者的思维中,参数在范围内的可能性为 100% 或 0%。在频率论者的思维中,你不能对一个事实做出概率陈述。

乔治华盛顿要么是第一任总统,要么不是。这是一个事实问题,不受概率陈述的影响。频率论者不能说“可能正在下雨”。贝叶斯可以。要么在下雨,要么没有。参数要么在范围内,要么不在。

您可以说的是,您有 95% 的置信度认为区间涵盖了参数。你不能说的是参数有 95% 的机会在区间内。那不是真的。

你有信心的是程序而不是数据。您的数据是随机收集的。它应该没有什么特别之处。因此,您的区间和样本均值也是随机的。他们也没有什么特别之处。人口参数是特殊的。使样本均值或置信区间在任何意义上的特殊之处在于它们与的关系。 μμ

它们总结了您收集的有关但不是的信息。如果您的模型有效,该过程可以保证您根据所看到的样本做出错误决定和采取错误行动的频率。μμ

即使是容忍间隔也需要你说明你想被愚弄的频率。没有绝对的公差区间;只有给定的区间数据和模型。α

要产生权重的概率,您应该在这种情况下真正应用贝叶斯方法。这与针对贝叶斯的频率论无关,但您在这里有一些非常强大的先验信息:您知道,一只鸡的体重不是负数,也不是 0.5 公斤。标准的常客方法基本上对所有结果都是开放的,通常假设正态分布的数据,而您的示例是非正态分布数据的一个很好的例子。

为自己找到一个可靠的先验分布,不包括负鸡(半正态先验呢?)并计算后验分布。从该后验分布中,您可以得出真实概率。