Stata中的“根MSE”是什么?

机器算法验证 回归 状态 线性模型 毫秒
2022-04-07 18:38:45

自从我去年学习计量经济学以来,我有一个问题一直困扰着我。当您回归 OLS 模型时,Stata 输出中的“根 MSE”是什么意思?

我知道它翻译成“均方根误差”,但它到底是哪个变量的均方误差,它是如何计算的?任何人都可以提供一个精确的定义和公式,并解释为什么拥有这个价值是有帮助的吗?

2个回答
  1. 计算观察到的和预测的因变量之间的差异
  2. 平方他们
  3. 将它们相加,这将为您提供 Stata 输出中的“误差平方和”SS
  4. 将其除以误差的自由度,这将为您提供“平均误差平方和”,Stata 输出中的 MS
  5. 取它的平方根,这就是 Root MSE
  6. 完毕

如果您查看 Stata 输出:

. sysuse auto, clear
(1978 Automobile Data)

. reg mpg weight

      Source |       SS       df       MS              Number of obs =      74
-------------+------------------------------           F(  1,    72) =  134.62
       Model |   1591.9902     1   1591.9902           Prob > F      =  0.0000
    Residual |  851.469256    72  11.8259619           R-squared     =  0.6515
-------------+------------------------------           Adj R-squared =  0.6467
       Total |  2443.45946    73  33.4720474           Root MSE      =  3.4389

------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0060087   .0005179   -11.60   0.000    -.0070411   -.0049763
       _cons |   39.44028   1.614003    24.44   0.000     36.22283    42.65774
------------------------------------------------------------------------------

将残差的平方和 (851.469) 除以其自由度 (72) 得到 11.826。那就是平方和的平均值。如果进一步取平方根,您将得到 Root MSE(输出中的 3.4289)。

基本上,这是对准确性的衡量。更准确的模型将具有更少的误差,从而导致更小的误差平方和,然后是 MS,然后是 Root MSE。但是,您只能在相同的因变量中应用此比较,因为 MS 和根 MSE 不是标准化的。根据测量单位的不同,根 MSE 可能会有很大差异。

RMSE 是模型误差的标准差。维基百科可以告诉你这个和公式:http ://en.wikipedia.org/wiki/Root-mean-square_deviation

有了它,你可以比较模型精度