在实验中使用控制变量?

机器算法验证 实验设计 治疗效果 随机分配
2022-03-10 08:49:20

在随机分配到治疗组的情况下,为什么要控制任意数量的基线协变量?

我的理解是,随机分配治疗应该使治疗变量严格外生,创建一个可以适当地被视为反事实的对照组。我能想到的唯一例外是当样本量很小时,随机分配仍然会产生不平衡的组。

任何想法都非常感谢。谢谢!

2个回答

如果结果取决于治疗以及其他可观察的因素,控制后者通常会提高影响估计的精度(即治疗效果的标准误差会更小)。当样本量较小时,这可能会有所帮助。

这是一个简单的模拟,即使处理是随机的,标准误差也会缩小三分之一:

. set obs 100
obs was 0, now 100

. gen treat =mod(_n,2)

. gen x=rnormal()

. gen y = 2 + 3*treat + 1*x + rnormal()

. reg y treat

      Source |       SS       df       MS              Number of obs =     100
-------------+------------------------------           F(  1,    98) =  112.75
       Model |  209.354021     1  209.354021           Prob > F      =  0.0000
    Residual |  181.973854    98  1.85687606           R-squared     =  0.5350
-------------+------------------------------           Adj R-squared =  0.5302
       Total |  391.327875    99  3.95280682           Root MSE      =  1.3627

------------------------------------------------------------------------------
           y |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
       treat |   2.893814   .2725345    10.62   0.000     2.352978     3.43465
       _cons |   2.051611    .192711    10.65   0.000     1.669183     2.43404
------------------------------------------------------------------------------

. reg y treat x

      Source |       SS       df       MS              Number of obs =     100
-------------+------------------------------           F(  2,    97) =  180.50
       Model |  308.447668     2  154.223834           Prob > F      =  0.0000
    Residual |  82.8802074    97  .854435127           R-squared     =  0.7882
-------------+------------------------------           Adj R-squared =  0.7838
       Total |  391.327875    99  3.95280682           Root MSE      =  .92436

------------------------------------------------------------------------------
           y |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
       treat |   2.918349   .1848854    15.78   0.000     2.551403    3.285295
           x |   1.058636   .0983022    10.77   0.000     .8635335    1.253739
       _cons |   1.996209    .130825    15.26   0.000     1.736558     2.25586
------------------------------------------------------------------------------

从频率论者的角度来看,基于排列分布的未经调整的比较总是可以在(适当的)随机研究之后得到证明。分布或分布)与置换分布的相似性,因此可以为推断做出类似的证明。事实上,调整协变量——当它们是基于事后分析选择时——实际上有夸大第一类错误的风险。请注意,这个理由与观察样本的平衡程度或样本的大小无关(除了对于小样本,排列分布将更加离散,并且不太能被tFt分布)。F

也就是说,许多人都知道调整协变量可以提高线性模型的精度。具体而言,当协变量可预测结果且与治疗变量不相关时(如随机研究的情况下如此),调整协变量可提高估计治疗效果的精确度。然而,鲜为人知的是,这不会自动延续到非线性模型。例如,Robinson 和 Jewell [1] 表明,在逻辑回归的情况下,控制协变量会降低估计治疗效果的精度,即使它们可以预测结果。然而,因为在调整后的模型中估计的治疗效果也更大,控制预测结果的协变量确实在随机研究后检验无治疗效果的零假设时提高效率。

[1] LD 罗宾逊和 NP 朱厄尔。关于逻辑回归模型中协变量调整的一些令人惊讶的结果。国际统计评论,58(2):227-40,1991。