多元线性回归模型的可接受 r 平方值

机器算法验证 多重回归 r平方 回归系数
2022-02-28 23:17:55

我目前正在写我的论文,更具体地说,我正在分析从研究人员那里收集到的关于他们正在进行的项目的一些数据。

最后,我进行了多元线性回归,以验证哪些决定因素(预算、团队规模……)显着影响研究项目的外部影响。虽然因变量(项目影响)是通过一项调查(在研究所的研究人员中进行的)评估的,但自变量是基于客观测量的。

在这种情况下,可接受的 r 平方百分比是多少?因变量的“主观性”可以证明低百分比是合理的吗?我听说科学领域很重要...即在物理学中,您宁愿需要 r-square > 95%,而在社会学中 > 5% 可能已经很有趣了...

你有这方面的参考吗?

4个回答

没有绝对的。不同的问题有不同的困难。唯一会让人拒绝某个 $R^2$ 的是另一种方法,使用预先指定或过拟合校正模型从同一数据集中获得更大的 $R^2$。

您的结果变量是主观的这一事实表明它将以非常不完美的可靠性进行测量。可靠性越低,与其他变量的相关性就越减弱,因此必须降低自己的标准。

我会尽力给你一个更具体的反应。只知道我所知道的少量,我猜想接近 0.35 的 RSQ 会让我作为评论者或其他读者非常感兴趣,并且对该模型的解释能力印象深刻;接近 0.20 的那个会让我有点兴趣;接近 0.10 的值似乎处于指示有用和无用模型之间的边界。

我假设您的因变量是某种离散的李克特式分数。如果是这样,我会确保 R 平方不接近任何一个极端,并更多地关注你的回归系数。

顺便问一下,你使用了什么样的回归模型?普通最小二乘法可能不适合用于呈现最终结果,但可以提供关系的良好第一个指标。对于最终论文,我会使用有序的概率或 logit。您希望非常清楚您对因变量施加的分布 - 例如,使用最小二乘法假设量表上的数字是等距的,而实际上人们在提供主观分数时非常不一致。

像你一样,我经常听说在社会学中,0.05 的 R 平方是可以接受的。我有时想知道这是否真的是正确的,或者它是否反映了社会学中缺乏科学严谨性(至少基于这一基准)。当然,0.05 的 R 平方对应于 0.22 的绝对 R 水平,这似乎在告诉你一些事情。

然而,在我让自己对如此低的 R 平方感到满意之前,我会做几件事。使用不同的数据集运行您的模型。在您的数据中使用保留数据点,看看您的模型预测因变量的效果如何。换句话说,您的模型结果可以用不同的数据集复制吗?您的模型是否具有预测性?这将定义您的模型是否具有比任意 R 平方阈值更有用的最小方向稳健性。

我直觉 R 平方为 0.05 时,相关模型的结果会被模型的标准误差压倒。而且,上面使用的简单方法可以帮助您记录这种现象。