当您有两组时,@NickCox 在讨论残差显示方面做得很好。让我来谈谈这个线程背后的一些明确的问题和隐含的假设。
问题是:“当自变量是二元时,你如何检验线性回归的假设,例如同方差性?” 你有一个多元回归模型。(多重)回归模型假设只有一个误差项,它在任何地方都是恒定的。单独检查每个预测变量的异方差性并不是很有意义(而且您也没有)。这就是为什么当我们有一个多元回归模型时,我们会根据残差与预测值的图来诊断异方差性。可能对这个目的最有用的图是比例位置图(也称为“扩展水平”),它是残差绝对值与预测值的平方根的图。要查看示例,线性回归模型中的“恒定方差”是什么意思?
同样,您不必检查每个预测变量的残差是否正常。(老实说,我什至不知道这将如何工作。)
您可以使用针对各个预测变量的残差图来检查是否正确指定了函数形式。例如,如果残差形成抛物线,则您错过的数据中有一些曲率。要查看示例,请在此处查看@Glen_b 答案中的第二个图: Checking model quality in linear regression。但是,这些问题不适用于二元预测器。
对于它的价值,如果您只有分类预测变量,您可以测试异方差性。您只需使用 Levene 的测试。我在这里讨论它:为什么 Levene 检验方差相等而不是 F 比率? 在 R 中,您使用car 包中的?levenTest。
编辑:为了更好地说明当您拥有多元回归模型时,查看残差与单个预测变量的图并没有帮助,请考虑以下示例:
set.seed(8603) # this makes the example exactly reproducible
x1 = sort(runif(48, min=0, max=50)) # here is the (continuous) x1 variable
x2 = rep(c(1,0,0,1), each=12) # here is the (dichotomous) x2 variable
y = 5 + 1*x1 + 2*x2 + rnorm(48) # the true data generating process, there is
# no heteroscedasticity
mod = lm(y~x1+x2) # this fits the model
从数据生成过程可以看出,不存在异方差性。让我们检查模型的相关图,看看它们是否暗示有问题的异方差性:

不,没什么好担心的。但是,让我们看一下残差与单个二元预测变量的关系图,看看那里是否存在异方差:

哦,看来确实可能有问题。我们从数据生成过程中知道不存在任何异方差性,并且用于探索这一点的主要图也没有显示任何异方差性,那么这里发生了什么?也许这些情节会有所帮助:

x1
并且x2
不是相互独立的。此外,观察结果x2 = 1
处于极端状态。他们有更多的杠杆,所以他们的残差自然更小。尽管如此,不存在异方差性。
带回家的信息: 您最好的选择是仅从适当的图(残差与拟合图和扩展水平图)中诊断异方差性。