问题背景:我正在使用双机器学习模型估计个体治疗效果。我不知道我的问题的真正治疗效果。
双 ML:给定 Y(结果)、T(治疗)和 X(特征)
Y = aT + bX + 误差
系数 a 是有意义的(衡量治疗效果)。
双 ML 程序:
- 拟合 Y ~ X => 计算残差 (Y* = Y – Y') – 残差是要估计的处理效果
- 拟合 T ~ X => 计算残差 (T* = T- T') – 该模型捕获由 X 解释的 T 的变化
- 在残差上拟合模型 (Y* ~ T* ) 将给出平均处理效果
我正在拟合一个线性回归模型(Y* ~ T*),并且没有一个系数具有统计学意义。我不依赖点估计,而是计算预测置信区间和 p 值来检查预测值是否具有统计显着性。
这种方法好吗?