在我看来,SEM 除了计算 CI 之外几乎没有什么用处?我们可以从 SEM 中获得哪些定量信息?我们可以说 1000 只鸡的真实平均体重很可能(非常定性)在 2 公斤到 8 公斤之间(样本平均值 ± SEM),但我们知道概率吗?
让我们从一个观察开始。SEM不是描述性统计数据。它来源于数据。它会告知您统计数据的抽样误差,但不会告知总体的不确定性。它是测量过程的产物。
如果您选择了不同的测量值,例如中位数,您将有不同的标准误差。同样,如果你的模型不同,你会有不同的标准误差。
有无数种可能的置信区间函数。您正在使用教科书中的标准版本,但它不是唯一的。这是一个具有理想属性的模型,因此它被教导,但如果您选择正式模拟您从获得不良样本中获得的损失,则可能会有不同的间隔。
SEM 提供特定于样品的信息。就您的问题而言,它的唯一用途是作为计算中的临时步骤。
置信区间告诉您对平均值(或其他一些统计数据)位置有信心的区域。置信区间没有告诉你鸡本身大小的分布。
您可能想要的间隔是容差间隔。 如果您想知道 95% 的鸡群可能下降的范围,那么您需要 95% 的容差区间而不是 95% 的置信区间。
如何解释 CI 的负下限?
置信区间的界限没有解释。它们是随机数。生成区间的函数是 % 置信区间,如果在无限重复时,该区间将覆盖参数的真实值至少 % 的时间。αα
如果你创建一个百分比置信区间并且它是那么解释是如果你表现得好像真实值在那个范围内那么你会被愚弄不到百分比的时间一旦重复变得非常大。α[a,b]α
负界限很好。假设我们是大自然母亲,你知道真实的人口平均体重是 4 公斤。您应该很高兴,因为区间包含实际值。下限确实是无意义的,但频率论方法允许无意义的答案,只要它在一定百分比的时间内覆盖了真实值。[−.88,10.88]
另外,请注意,窄间隔并不比更宽的间隔更好。窄的并不比宽的更准确。它们同样精确,因为它们在大量重复时至少在固定百分比的时间内覆盖了真实值。
要了解原因,假设您将鸡群随机分成两半并称重。一半鸡的间隔比另一半小。随机化过程如何使一组更准确?没有什么。
真实平均体重落在 0 kg - 10.88 kg 范围内的概率有多大?
这是一个特定于模型的问题。我会担心您的数据不是正态分布的。虽然它们可能是正态分布的,但考虑到大致相同的年龄和饮食,人口中包含小鸡和非常老的鸡。我会惊讶地发现它们通常是在不受控制的基础上分布的。
但是,如果我们假设鸡彼此足够相似以达到正态分布,那么我们就可以开始解决您的问题了。
首先,置信区间不是概率的陈述。如果你想要一个概率,那么你将需要使用贝叶斯模型。贝叶斯可信区间将告诉您参数在某个范围内的概率。频率论方法不会这样做。
原因是在频率论者的思维中,参数在范围内的可能性为 100% 或 0%。在频率论者的思维中,你不能对一个事实做出概率陈述。
乔治华盛顿要么是第一任总统,要么不是。这是一个事实问题,不受概率陈述的影响。频率论者不能说“可能正在下雨”。贝叶斯可以。要么在下雨,要么没有。参数要么在范围内,要么不在。
您可以说的是,您有 95% 的置信度认为区间涵盖了参数。你不能说的是参数有 95% 的机会在区间内。那不是真的。
你有信心的是程序而不是数据。您的数据是随机收集的。它应该没有什么特别之处。因此,您的区间和样本均值也是随机的。他们也没有什么特别之处。人口参数是特殊的。使样本均值或置信区间在任何意义上的特殊之处在于它们与的关系。 μμ
它们总结了您收集的有关但不是的信息。如果您的模型有效,该过程可以保证您根据所看到的样本做出错误决定和采取错误行动的频率。μμ
即使是容忍间隔也需要你说明你想被愚弄的频率。没有绝对的公差区间;只有给定的区间数据和模型。α