我目前正在使用多元线性回归构建模型。在摆弄我的模型之后,我不确定如何最好地确定要保留哪些变量以及要删除哪些变量。
我的模型从 DV 的 10 个预测变量开始。当使用所有 10 个预测变量时,有四个被认为是显着的。如果我只删除一些明显不正确的预测变量,我的一些最初并不重要的预测变量就会变得重要。这引出了我的问题:如何确定要在他们的模型中包含哪些预测变量?在我看来,您应该使用所有预测变量运行一次模型,删除那些不重要的,然后重新运行。但是,如果仅删除其中一些预测变量会使其他预测变量变得重要,那么我想知道我是否对这一切采取了错误的方法。
我相信这个线程与我的问题相似,但我不确定我是否正确解释了讨论。也许这更像是一个实验性的设计主题,但也许有人有一些经验可以分享。