当没有一个系数在统计上显着时,可以相信回归预测吗?

数据挖掘 线性回归
2022-02-26 04:40:31

问题背景:我正在使用双机器学习模型估计个体治疗效果。我不知道我的问题的真正治疗效果。

双 ML:给定 Y(结果)、T(治疗)和 X(特征)

Y = aT + bX + 误差

系数 a 是有意义的(衡量治疗效果)。

双 ML 程序:

  1. 拟合 Y ~ X => 计算残差 (Y* = Y – Y') – 残差是要估计的处理效果
  2. 拟合 T ~ X => 计算残差 (T* = T- T') – 该模型捕获由 X 解释的 T 的变化
  3. 在残差上拟合模型 (Y* ~ T* ) 将给出平均处理效果

我正在拟合一个线性回归模型(Y* ~ T*),并且没有一个系数具有统计学意义。我不依赖点估计,而是计算预测置信区间和 p 值来检查预测值是否具有统计显着性。

这种方法好吗?

1个回答

这取决于项目的目标。

统计意义对于在学术期刊上发表更为重要。对于应用项目,统计显着性不太重要。

即使一个模型在统计上不显着,它也可能有价值。该模型可以总结数据并识别关系。该模型可能具有实际意义,其效果可能对从业者具有价值。