我对 X 对 Y 的影响感兴趣,并想调整回归模型中的混杂变量。如果模型(回归,F 检验)不显着,但我感兴趣的预测变量是,我还能报告 X 和 Y 之间存在关联吗?所以我只想调整混杂变量,但我的兴趣是 X 和 Y 之间的关系。谢谢。
劳伦
我对 X 对 Y 的影响感兴趣,并想调整回归模型中的混杂变量。如果模型(回归,F 检验)不显着,但我感兴趣的预测变量是,我还能报告 X 和 Y 之间存在关联吗?所以我只想调整混杂变量,但我的兴趣是 X 和 Y 之间的关系。谢谢。
劳伦
回归的一个目的是控制协变量的影响。这个问题基于(正确的)理解,即不应将此目的与测试这些协变量的重要性相混淆。
在线性多元回归模型中
检验比较原假设
替代方案
在您的情况下,您对这个假设不感兴趣,因为这些系数中的大多数都与协变量相关联。让是您感兴趣的单个预测变量的索引,是数据量,您的测试应该基于比较
至
这通常通过 t 检验完成,其中估计值除以其标准误差,得到的 t 统计量称为具有自由度的 Student t 分布. 如果您认为该结果显着,那么您将拒绝该原假设(而不是 F 检验的综合原假设)并得出结论,在控制所有协变量后,发现变量显着相关。
请注意,如果您打算分别进行多个此类测试,涉及多个变量,那么此过程将不再适用于其中任何一个。上下文很重要!您需要首先执行测试以查看该组变量中的任何一个是否重要。通常的程序是基于与感兴趣变量相关的“额外平方和”的 F 检验。在单个变量的情况下,此 F 检验在数学上等同于 Student t 检验。
更微妙的是,请注意,重要的是您计划在查看数据之前进行的测试次数。如果您首先检查数据,然后根据该检查选择作为唯一感兴趣的变量,那么您将不得不弄清楚如何解释您使用的附加信息,以便将模型缩小到这个单一变量. 例如,您可能会尝试(尽可能诚实地)列举您可能对测试感兴趣的所有变量,然后将它们视为刚刚描述的一组。
Montgomery、Peck 和 Vining,线性回归分析简介。 第五版,2012 年。约翰威利父子公司。第 3.3 节。
总体 F 检验下的零假设如下:
H0: β1 = β2 = ... = βm= 0
Ha: At least one of the slope parameters is not equal to 0.
看看备择假设(Ha),我怀疑一旦您无法拒绝 Null,您就无法对单个系数发表任何看法。
话虽如此,未能拒绝 NULL 仅意味着 X 和 Y 之间的关系不能用给定的模型来解释(在这种情况下是线性的)。您可以尝试 X 和 Y 之间的另一种规范或非线性规范。