基于均值和标准误差的样本组合

机器算法验证 意思是 标准错误
2022-04-09 00:40:16

我有两个样本,每个样本都有平均值和 SE。我想将它们组合起来,那么在组合两个样本均值时如何计算组合标准误差?我目前只能找到有关组合方式和 SD 的信息。

2个回答

如果您的第一个总体具有平均值和方差则数据的样本平均值具有方差其中是样本大小。同样,对于您的第二个样本,样本均值的方差为μ1σ12,x¯1σ12n1,n1x¯2σ22n2.

组合样本均值的方差为12(x¯1+x¯2)14(σ12n1+σ22n2).

所以它的标准差是12σ12n1+σ22n2

标准误差是这个标准差的估计值,由其中是样本标准差。12s12n1+s22n2,s1s2

请注意,这是两个样本均值的简单平均值,而不是加权版本。

在您的情况下,您似乎正在尝试进行一种荟萃分析,您希望在其中表现得好像这两项研究是一个研究,并且具有相应的较大 N。

请记住,样本均值的方差与从中获取相同值的 N 相关。当 N 相等时,您只能平均跨研究的样本均值方差。这个平均方差似乎不是您想要的。相反,您想要做的是在研究中获得加权方差(不是样本均值,而是每个样本的方差估计),然后使用它来获取样本均值的标准误差,将组合 N 作为样本。因此,对于加权方差,您可以以通常的方式组合方差。鉴于您只有 Ns 和 SEs,那么您首先需要获得每项研究的方差。

var1 = SE1^2 * n1
var2 = SE2^2 * n2

然后汇集这些产生的差异

( var1 * (n1-1) + var2 * (n2 - 1) ) / (n2 + n1 - 2) 

然后计算新的标准误。

SE = sqrt(varPooled / N)

鉴于您在评论中对您想要了解的内容的描述,您可能应该这样做。