如果不是,是否需要施加任何限制以确保两个样本的值相同?如果这是一个如此基本的问题,我提前道歉。
给定两个具有相同平均值、标准差和 N 的样本:每个样本中的值是否相同?
机器算法验证
分布
意思是
标准差
样本量
2022-03-11 02:28:50
2个回答
给定两个具有相同平均值、标准差和 N 的样本:每个样本中的值是否相同?
一般来说,除非两个样本中的 N = 2,否则不会。如果 N 大于 2,则它们可能不同。
你可以通过一些简单的案例来简单地看到这一点。
也许最简单的情况是取一个大小为的不对称样本并将其翻转到其平均值附近(和的平均值为;如果你分别取一个和的新样本,它有与原始样本具有相同的均值和与均值的相同幅度的偏差,因此它将具有相同的方差,因此具有相同的标准偏差)。
再举一个例子,考虑这三个具有相同标准偏差的大小为 3 的样本:
A组:
设置 B: (其中 )
(即大约 -.57735,-.57735,1.1547)
设置 C: (其中 )
(即大约 -0.7559289, -0.3779645, 1.1338934)
这些都具有均值 0 和 sd 1。您可以通过乘以所需的标准偏差,然后加上所需的均值,从中得出任何其他均值和 sd。
如果不是,是否需要施加任何限制以确保两个样本的值相同?
当然,您需要额外的限制,将数据的可用自由度降低到 0。这些限制可能采用多种形式,例如指定偏度、中值或样本最大值等。
并非所有额外的限制总是可以将自由维度减少一(有一些现有的限制,一些额外的限制可能是多余的),但这通常是它所需要的。
不会。许多数据集可以产生相同的平均值、SD 和 n。
在上图中,每张图左侧的三个数据集都共享相同的均值、SD 和 n。每张图右侧的三个数据集也是如此。这是来自:Weissgerber, TL, Milic, NM, Winham, SJ 和 Garovic, VD (2015) 的图 1。超越条形图和折线图:是时候采用新的数据表示范式了。公共科学图书馆生物学 13:e1002128。