你如何“控制”一个因素/变量?

机器算法验证 回归 自习 方差分析 实验设计 控制变量
2022-01-20 20:41:08

据我了解,“控制”在统计中可以有两种含义。

  1. 对照组:在实验中,对照组的成员不接受任何治疗。例如:安慰剂与药物:您将药物给予一组而不是另一组(对照),这也称为“对照实验”。

  2. 变量控制:分离特定自变量影响的技术。这种技术的一些其他名称是,“占”,“保持不变”,“控制”,一些变量。例如:在一项足球观看研究(喜欢或不喜欢)中,您可能想去掉性别的影响,因为我们认为性别会导致偏见,也就是说,男性可能比女性更喜欢它。

所以,我的问题是针对第 (2) 点的。两个问题:

一般来说,你如何“控制”/“解释”变量。使用了哪些技术?(就回归而言,ANOVA 框架)。

在上面的例子中,随机选择男性和女性是否构成控制?也就是说,“随机性”是控制其他效果的技术之一吗?

2个回答

如前所述,控制通常意味着在回归中包含一个变量(正如@EMS 所指出的,这并不能保证实现这一目标的任何成功,他链接到这个)。关于这个主题已经存在一些投票率很高的问题和答案,例如:

这些问题的公认答案都是对您在观察(我会说相关)框架内提出的问题的很好处理,更多这样的问题可以在这里找到。

但是,您是在实验或 ANOVA 框架内专门提出您的问题,可以就该主题提出更多想法。

在实验框架内,您通过在不同实验条件下随机分配个体(或其他观察单位)来控制变量。基本假设是,因此条件之间的唯一区别是实验处理。当正确随机化(即每个人在每种情况下都有相同的机会)时,这是一个合理的假设。此外,只有随机化才能让您从观察中得出因果推论,因为这是确保没有其他因素对您的结果负责的唯一方法。

但是,也可能有必要在实验框架内控制变量,即当有另一个已知因素也影响该因变量时。提高统计能力,然后可以是控制这个变量的好主意。用于此的常用统计程序是协方差分析(ANCOVA),它基本上也只是将变量添加到模型中。

现在到了关键:要使 ANCOVA 合理,绝对关键的是分配给组是随机的,并且控制它的协变量与分组变量不相关。
不幸的是,这经常被忽略,导致无法解释的结果。Miller & Chapman (2001)对这个确切的问题(即何时使用或不使用 ANCOVA)给出了一个非常易读的介绍

尽管在许多场所进行了许多技术处理,但协方差分析 (ANCOVA) 仍然是一种被广泛滥用的方法来处理潜在协变量的实质性群体差异,特别是在精神病理学研究中。发表的文章得出毫无根据的结论,一些统计文本忽略了这个问题。审查了在这种情况下 ANCOVA 的问题。在许多情况下,没有办法实现“纠正”或“控制”潜在协变量上的实际群体差异这一表面上有吸引力的目标。为了减少对 ANCOVA 的滥用并促进适当使用,提供了非技术性讨论,强调教科书和其他一般性演示中很少阐明的实质性混淆,以补充现有的数学批评。


乔治亚州米勒和 JP 查普曼 (2001)。对协方差分析的误解。异常心理学杂志,110(1),40-48。doi:10.1037/0021-843X.110.1.40

为了控制一个变量,可以在相关特征上均衡两组,然后比较您正在研究的问题的差异。我只能用一个例子来解释这个,而不是正式的,B-school 是几年前的事了,所以那里。

如果你会说:

巴西比瑞士富裕,因为巴西的国民收入为 35240 亿美元,而瑞士只有 5510 亿美元

从绝对意义上讲,您是正确的,但是任何 12 岁以上对世界了解过的人都会怀疑该陈述也有问题。

最好把瑞士的人口提升到巴西的水平,然后再比较收入。所以,如果瑞士的人口有巴西那么大,他们的收入将是:

(2.1 亿 / 850 万)* 5510 亿美元 = 13612 亿美元

这使得他们的财富大约是巴西的 4 倍,拥有 35240 亿美元。

是的,您也可以采用人均方法,比较平均收入。但是上面的方法,你可以多次应用。