为什么称为决定系数()?R2R2

机器算法验证 回归 r平方 词源
2022-04-13 15:51:01

如果我至少不知道它们的词源或与它们相关的领域中的其他概念,我很难记住这些术语。

“确定”似乎在“确定系数”之外没有任何意义,这与“相关系数”相反,其中相关性本身就是明确定义的。为什么为选择这个特定的词?R2

2个回答

这个谷歌搜索出现了一个有趣的结果。

以下是我的推测。

确定性模型是“通过状态和事件之间的已知关系精确确定结果的数学模型,没有任何随机变化的空间”。来自:什么是确定性模型?

我认为可以根据模型的确定/已知(无变化)来考虑确定系数。如果,则 100% 的预测变量和结果之间的关系被确定。如果你为你的预测变量输入值,你总是会得到一个没有错误项的预测。您知道结果,不会有任何错误或任何类型的变化。您的模型类似于R2=1.002+3=5

通常,您没有 100%,因此即使我们在预测变量上具有相同值的两个案例中获得相同的预测值,也会存在一些错误。因此,这两种情况的正确预测仍然未知,并且正确的预测可能不同。但是这些正确的预测在某种程度上是确定的(或者我们知道它们) -的范围。R2R2

这是我的 2 美分。我们的模型包含的方差有 2 种类型:随机(完全概率,可能会根据我们选择的样本而变化),而存在可以通过我们的建模技术量化或确定的方差。现在,由于我们的计算涉及理解 R^2 的值,这解释了通过我们的模型解释了多少确定性方差,所以正确地称为。只是一个假设。