正值的置信区间可以为负吗?

机器算法验证 假设检验 置信区间
2022-04-01 00:27:42

+-如果我使用样本均值样本标准差,正值的置信区间可以为负吗?

如果我需要一个对数图(带有置信区间),在这种情况下我应该怎么做?

1个回答

第一个问题有一个简单的答案:是的。

我将您的问题解释为,“一个严格的正样本(所有数据点都是正的)是否可以具有负下限的正态分布的 68% 置信区间?”

构造证明:令平均值为,样本标准差为,因此 68% 置信区间为X=[1,1,7]T33.46(0.464,6.46)

包含零的置信区间的一个后果是我们无法拒绝真实总体具有均值为零的正态分布的假设。

置信区间是相对于特定分布定义的。将置信区间定义为均值 +/- 样本标准差隐含地假定了正态分布,或者至少是对称分布。如果我们选择一个本身为非负的分布,比如或 Poisson,那么置信区间将永远不会低于零。但是,它将是不对称的。χ2

在对数图上绘制置信区间不太明确。我可以看到问题是如何出现的:对数图完全适用于严格的正数据,但是没有一种明显的方法可以绘制置信区间。以下是一些选项,它大致增加了难度:

  1. 最简单的方法是将其扩展到负无穷大 - 换句话说,只需将其扩展到图表底部并将其切断。
  2. 如果对 CI 使用箱线图,则在 Q1 和 Q3 四分位数之间绘制“框”,因此“框”部分将始终严格包含在原始数据的范围内,而只有“晶须”部分会扩展向下超过图表的底部。
  3. 箱线图的一个稍微复杂的版本是小提琴图小提琴的形状会在图表的底部消失,但在视觉上会清楚地看到有多少被剪掉了。
  4. 如果您在对数转换计算置信区间,您可能会得到一个对您的数据更有意义并保留在图上的 CI。
  5. 如果您拟合不同的分布,例如计数数据的泊松,那么您可以从中计算 CI,并且 CI不会低于零,因为拟合分布本身不能。