基于独立 CI 的差异 CI

机器算法验证 置信区间
2022-03-30 08:53:13

我想在这里检查我的逻辑。

假设您测量 A 组中的一个数量,发现平均值为 2,您的 95% 置信区间范围为 1 到 3。然后您测量 B 组中的相同数量,发现平均值为 4,95% 置信区间范围为从 3.5 到 4.5。假设 A 和 B 是独立的,那么组间差异的 95% 置信区间是多少?大概您可以使用标准 t 统计量来计算它,但我想知道是否也可以仅根据 CI 计算估计值。

我认为差异的CI下限应该是A和B之间的最小可信差异;也就是说,B (3.5) 的区间下限减去 A (3) 区间的上限,得出差值为 0.5 的下限。同理,差值CI的上界应该是A&B之间的最大可信差值;也就是说,B (4.5) 的区间上限减去 A (1) 区间的下限,得出差值为 3.5 的下限。因此,这种推理产生了介于 0.5 到 3.5 之间的差异的置信区间。

这有意义吗,或者这是逻辑和统计数据不同的情况?

1个回答

不,恐怕您不能以这种方式计算差异的 CI,出于同样的原因,您不能使用 CI 是否重叠来判断差异的统计显着性。参见,例如,

“通过检查置信区间之间的重叠来判断差异的重要性” Nathaniel Schenker,Jane F Gentleman。美国统计学家。2001 年 8 月 1 日,55(3):182-186。doi:10.1198/000313001317097960。 http://pubs.amstat.org/doi/abs/10.1198/000313001317097960

或者:

重叠置信区间或标准误差区间:它们在统计显着性方面意味着什么?Mark E. Payton、Matthew H. Greenstone 和 Nathaniel Schenker。昆虫科学杂志 2003;3: 34. http://www.ncbi.nlm.nih.gov/pmc/articles/PMC524673/

正确的程序要求您还知道两组的样本量。然后,您可以从 CI 反向计算两个标准差,并使用它们进行标准的双样本 t 检验,或计算差异的标准误差,从而计算差异的 CI。