我一直在网上搜索术语依赖和独立样本,但我找不到正确的定义,也无法得出确切的结论。如果你们中的任何人都可以解释它并将知识传授给我们,那就太好了。
依赖与独立样本
阅读所有答案和评论,很明显我们在这里有一点 Catch-22。人们无法在没有更多上下文的情况下回答这个问题,但这个问题似乎是在询问那个上下文。
所以,我要试一试,试图猜测 Serenity Stack Holder 的含义。
如果两个样本(或两个以上)以某种方式连接,则它们是相关的,而不是必然具有相似的结果,而是通过使一个结果以某种方式依赖于另一个结果。例如,假设我对比较男性和女性的身高感兴趣。如果我从某个人群中随机挑选 50 名女性和 50 名男性,则样本是独立的,因为一个人的身高与另一个人的身高无关。一件事没有给你关于另一件事的信息。但是,如果我选择 50 对异性恋夫妇,这两个样本不会是独立的,因为人们倾向于与身高相似的人结婚。
我希望这有帮助!
@whuber 是对的,我们需要更多的上下文来解读您所说的“样本”是什么意思。如果您的意思是“采样的结果”意义上的“样本”,因此您将该术语用作“实现”的同义词,则以下适用:
样本依赖于一些(或可能没有)先验知识,当且仅当了解一个样本的某些信息可以告诉您有关另一个样本的新信息。
最常见的情况是样本根据分布被假定为“独立同分布” 。在这种情况下,假设您知道是一个均值为零且方差为 1 的正态分布,知道的值为的信念仍然是它遵循。但是,在不知道的情况下,但知道样本是来自某个正态分布的独立同分布的情况下,这会使样本明显依赖:知道关于一个的某些信息会告诉您有关的某些信息,这会告诉您有关另一个的某些信息。
如果不假设样本之间的依赖或独立,就不可能知道它们是依赖的还是独立的,但人们通常可以通过尝试找到模式来做出很好的猜测。上面的例子中的相关性就是这样一种模式。
术语:
我是化学家。我有许多样本,它们在统计意义上共同构成一个样本。
另请参阅:如何定义“样本”是什么?
也许一个简单的案例列表是一个开始:
如果您的样本是相关的,则它们不是独立的(但您不能反过来得出结论)。
(有点明显):如果一个样本影响另一个样本,它们不是独立的
如果您知道影响两个样本的原因,则它们不是独立的
如果一旦您知道另一个样本的结果(即比从整体分布中猜测更好),您就能够改进对一个样本感兴趣的任何内容的预测,那么样本不是独立的。
争论独立总是很困难的:想象一下,你研究头发颜色,然后每 30 分钟从办公室门前的街道上抓人一次。您可能会认为这些人是独立的:没有办法比猜测平均头发颜色更好地预测另一个人的头发颜色。但是你怎么知道(证明!)你没有错过预测头发颜色的正确模型?
(in)dependence 可以讨论研究的范围:现在您在地球另一端的同事加入您的研究,并在他的办公室前向您发送人们的头发颜色。现在,您可以比从您收集的最后一个头发颜色中的一般猜测更好地预测即将到来的头发:头发颜色与地理区域无关。
你可能会说,要研究的人群需要明确定义,以证明(不)独立性:是“出现在我办公室前的头发颜色”还是“人类的头发颜色”?