不正确的线性模型何时变得非常漂亮?

机器算法验证 回归 参考 线性模型 强大的
2022-03-03 07:31:45

是在实践中使用了不正确的线性模型,还是科学期刊中不时描述的某种好奇心?如果是这样,它们在哪些领域使用?它们什么时候有用?

它们基于线性回归

y=a+biwixi+ε

wj不是模型中估计的系数,而是

  • 每个变量相等wi=1单位加权回归),
  • 基于相关性wi=ρ(y,xi)(达纳和道斯,2004),
  • 随机选择(Dawes,1979),
  • 1对于与负相关的变量y,1对于正相关的变量y(韦纳,1976)。

我还看到了功能z-缩放并使用简单的线性回归对输出进行加权

y=a+bv+ε

在哪里v=wix, 并且可以使用 OLS 回归简单地估计。

参考文献:
Dawes, Robyn M. (1979)。不恰当的线性模型在决策中的强大之美美国心理学家, 34,571-582。

Graefe, A. (2015)。使用等权重的预测器改进预测商业研究杂志,68 (8),1792-1799。

怀纳,霍华德 (1976)。估计线性模型中的系数:没关系心理公报 83 (2), 213。

Dana, J. 和 Dawes, RM (2004)。社会科学预测回归的简单替代方案的优越性教育与行为统计杂志,29 (3), 317-331。

1个回答

实际上,在我看来,这是假设的协方差结构的分类。换句话说,这是一种贝叶斯先验建模。

与普通的 MLR 程序相比,这增加了鲁棒性,因为参数的数量 (df) 被减少,并且由于增加的省略变量偏差OVB 而引入了不准确性。由于OVB,坡度变平,|β^|<|β|, 决定系数降低R^2<R2.

我个人的经验是,优于贝叶斯方法的是使用更好的建模;变换参数,使用其他规范,和/或使用非线性方法。也就是说,一旦问题的物理特性和方法得到适当的探索和协调,F 统计量、决定系数等就会提高而不是降低。