简单线性回归输出解释

机器算法验证 回归 r平方
2022-01-28 04:36:12

我对 2 个变量的自然对数进行了简单的线性回归,以确定它们是否相关。我的输出是这样的:

R^2 = 0.0893

slope = 0.851

p < 0.001

我很困惑。查看值,我会说这两个变量相关,因为它非常接近但是,回归线的斜率几乎为(尽管它在图中看起来几乎是水平的),并且 p 值表明回归非常显着。R201

这是否意味着这两个变量高度相关?如果是这样,值表示什么?R2

我应该补充一点,在我的软件中测试了 Durbin-Watson 统计数据,并且没有拒绝原假设(它等于)。我认为这测试了变量之间的独立性。在这种情况下,我希望变量是依赖的,因为它们是测量。我正在将这种回归作为确定个人身体状况的已发表方法的一部分,因此我认为以这种方式使用回归是有意义的。但是,鉴于这些输出,我想也许对于这些鸟来说,这种方法不适合。这似乎是一个合理的结论吗?1.35722

4个回答

斜率的估计值本身并不能告诉您关系的强度。关系的强度取决于误差方差的大小和预测变量的范围。此外,显着的值并不一定告诉您存在很强的关系;值只是测试斜率是否正好为 0。对于足够大的样本量,即使与该假设的小偏差(例如不具有实际重要性的偏差)也会产生显着的pppp

在您提出的三个量中决定系数最能说明关系的强度。在您的情况下,意味着的变化可以解释为与预测变量的线性关系。什么构成“大”取决于学科。例如,在社会科学中,可能是“大”的,但在工厂设置等受控环境中,才能表示存在“强”关系。在大多数情况下是一个非常小的R2R2=.0898.9%R2R2=.2R2>.9.089R2,所以你认为存在弱线性关系的结论可能是合理的。

告诉您模型解释了因变量的 多少变化。但是,可以解释以及因变量的原始值与拟合值之间的相关性。可在此处找到决定系数的准确解释和推导。R2R2R2

可以在此处找到确定系数等于观测值和拟合值之间的平方 Pearson 相关系数的证明。yiy^i

或决定系数表示您的模型在解释因变量方面的强度在您的情况下,这表明您的模型能够解释 8.9% 的因变量变化。或者,你的和你的拟合值之间的相关系数是 0.089。构成良好的因素取决于学科。R2R2=0.089yiy^iR2

最后,到你问题的最后一部分。您无法通过 Durbin-Watson 检验来说明因变量和自变量之间的相关性。Durbin-Watson 检验检验序列相关性。进行它是为了检查您的错误项是否相互关联。

值告诉您拟合模型解释了数据的多少变化。R2

您研究中的低值表明您的数据可能广泛分布在回归线周围,这意味着回归模型只能解释(非常少)数据中 8.9% 的变化。R2

您是否检查过线性模型是否合适?查看残差的分布,因为您可以使用它来评估模型与数据的拟合度。理想情况下,您的残差不应显示与您的值的关系,如果是,您可能需要考虑以合适的方式重新调整变量,或者拟合更合适的模型。x

对于线性回归,拟合斜率将是相关性(当平方时,给出确定系数)乘以回归的经验标准差()除以经验标准差回归量()。根据的缩放比例,您可以使拟合斜率等于 1,但值可以任意小。R2yxxyR2

简而言之,除非您确定因变量和自变量的尺度必须彼此相等,否则斜率并不是模型“拟合”的良好指标。