我正在评估一个物理模型,并想知道我应该在这里使用哪种方法(在 RMSE 和确定系数 R2 之间)
问题如下:我有一个函数输出输入值 x,的预测。的那个值进行了实际观察。
的优缺点是什么。我已经看到它们都被用于我正在研究的问题的论文中。
我正在评估一个物理模型,并想知道我应该在这里使用哪种方法(在 RMSE 和确定系数 R2 之间)
问题如下:我有一个函数输出输入值 x,的预测。的那个值进行了实际观察。
的优缺点是什么。我已经看到它们都被用于我正在研究的问题的论文中。
这两个我都用过,有几点要说。
对于一个有抱负的计算机科学家来说,写关于统计的文章是令人兴奋的。敬上。
无论您给出什么错误测量值,请考虑在附录中给出完整的结果向量。喜欢与您的方法进行比较但更喜欢另一种误差测量的人可以从您的表中得出这样的值。
:
不反映系统误差。想象一下,您测量的是直径而不是圆形物体的半径。您的预期高估为 100 %,但仍可以达到接近 1
不同意之前的评论,难以理解。值越高,模型越精确,但它可能包含系统误差。
可以用易于理解的公式表示,在该公式中,您构建残差平方和的比率并除以总平方和 (TSS):
此公式的比率也可以解释为模型解释的方差与数据总方差的比值。
:
只有同时具有高精度(单个但较大的异常值会受到严重惩罚)并且没有系统误差,您才能达到低因此,在某种程度上,低保证比高更好的质量。
这个数字有一个单位,不熟悉你的数据的人不容易解释。例如,它可以与数据的平均值相除以产生。小心,这不是。有些人更喜欢除以他们的数据范围,而不是除以平均值。
正如其他人提到的,选择可能取决于您的领域和最先进的技术。是否也有一种被广泛接受的比较方法?使用与他们相同的测量方法,您可以在讨论中轻松地将您的方法优势直接联系起来。
均方根误差 (RMSE)和决定系数 ( )都提供了不同但互补的信息,在评估您的物理模型时应该评估这些信息。两者都不是“更好”,但根据特定应用程序,一些报告可能更多地关注一个指标。
我将使用以下内容作为理解这两个指标之间差异的非常通用的指南:
RMSE让您了解您的预测值与您尝试建模的实际数据之间的距离(或远近)。这在您希望了解模型预测的准确性和精确度(例如,建模树的高度)的各种应用程序中非常有用。
优点
缺点
当您试图了解您选择的自变量如何解释因变量的可变性时,决定系数 ( )很有用。当您试图解释哪些因素可能推动感兴趣的潜在过程(例如,与树高相关的气候变量和土壤条件)时,这很有用。
优点
缺点
当然,以上内容会受到样本量和抽样设计的影响,一般理解相关并不意味着因果关系。
还有 MAE,平均绝对误差。与 RMSE 不同,它对大错误并不过分敏感。根据我的阅读,一些领域更喜欢 RMSE,另一些更喜欢 MAE。我喜欢两者都用。