我用一个连续响应变量和一个分类解释变量(有 2 个水平)运行了一个简单的回归。我目前正在检查模型是否符合回归假设。我制作了以下情节:
我知道我需要检查残差是否呈正态分布。我是否需要检查解释变量的 2 个水平中每个水平的残差分布?还是我需要同时检查所有残差的分布?
我用一个连续响应变量和一个分类解释变量(有 2 个水平)运行了一个简单的回归。我目前正在检查模型是否符合回归假设。我制作了以下情节:
我知道我需要检查残差是否呈正态分布。我是否需要检查解释变量的 2 个水平中每个水平的残差分布?还是我需要同时检查所有残差的分布?
(请注意,只有 1 个分类解释变量且只有 2 个水平的回归模型等效于 t 检验;将其称为回归并没有错,但它最常被讨论/称为 t-测试。)
您同时检查所有残差的分布。有正常性测试,但我不是它们的忠实粉丝(我在对你之前问题的回答中列出了一些)。我认为最好的选择是制作一个qq-plot。你可以在 John Fox 的car package中找到一个非常好的版本(qq.plot ) 。在其他功能中,它会给你一个 95% 的置信带,它可以帮助你解释情节。
另一方面,从查看您的情节来看,我不知道您在第二组中是否有更多数据,但您还应该检查以确保您具有方差同质性。