当我的 t 统计量如此之大时,为什么我的 R 平方如此之低?

机器算法验证 回归 假设检验 计量经济学
2022-02-14 01:01:55

我用 4 个变量进行了回归,所有变量都非常具有统计意义,T 值(我说是因为包含小数似乎无关紧要),它们非常高且明显显着。但是只是 0.2284。我是否将此处的 t 值误解为它们不是的意思?我看到 t 值的第一反应是会很高,但也许这是一个高7,9,2631R2R2R2

4个回答

用于判断非常不同的事物用于判断您对的估计的准确性,但衡量您的协变量解释的响应变量的变化量。假设您正在估计具有观测值的回归模型,tR2tβiR2n

Yi=β0+β1X1i+...+βkXki+ϵi

其中 ,ϵii.i.dN(0,σ2)i=1,...,n

值(绝对值)会导致您拒绝的原假设。这意味着您可以确信您已经正确估计了系数的符号。此外,如果>4 并且您有,则 0 不在系数的 99% 置信区间内。系数值是估计与由标准误差归一化的 0 之间的差异。tβi=0|t|n>5tβiβi^se{βi^}

t=βi^se{βi^}

这只是估计值除以其可变性的度量。如果您有足够大的数据集,您将始终具有统计上显着(大)的这并不一定意味着您的协变量解释了响应变量的大部分变化。t

正如@Stat 所提到的,衡量您的因变量解释的响应变量的变化量。有关的更多信息,请访问维基百科在您的情况下,您似乎有足够大的数据集来准确估计的,但您的协变量在解释和\或预测响应值方面做得很差。R2R2βi

说与 caburke 相同的事情,但更简单地说,您非常确信由变量引起的平均响应不为零。但是在回归中还有很多其他的东西是你没有的,它们会导致响应跳来跳去。

可能是因为尽管您的预测变量在响应变量方面呈线性趋势(斜率与零显着不同),这使得 t 值显着,但 R 平方较低,因为误差很大,这意味着您的数据很大,因此您的回归模型不合适(预测不准确)?

只是我的2美分。

也许这篇文章可以提供帮助:http ://blog.minitab.com/blog/adventures-in-statistics/how-to-interpret-a-regression-model-with-low-r-squared-and-low-p-价值观

给出的几个答案很接近,但仍然是错误的。

“t 值用于判断您对 βi 的估计的准确性”是我最关心的问题。

T 值只是随机发生的可能性的指示。大意味着不太可能。小意味着很有可能。正面和负面对可能性解释无关紧要。

“R2 衡量由协变量解释的响应变量的变化量”是正确的。

(我会发表评论,但这个平台还不允许。)