用于条件推理回归树的测试统计量是什么?

机器算法验证 r 大车 派对
2022-04-06 11:16:18

Hothorn 等人中,检验统计量指定为

Tj(Ln,w)=vec(wigj(Xji)h(Yi,(Y1,...,Yn)T))

这个具有连续响应、类别和数值预测变量的检验统计量的确切形式是什么?

1个回答

如果回归量和响应都是数字,则默认选择因此,线性检验统计量只是乘积的总和。这基本上对应于协方差或相关性的主要成分 - 并且随着线性检验统计量的后续标准化,它成为相关性检验统计量。XjiYig()h()TjXjiYiTj

如果其中一个变量是分类变量,则相应的变换()是所有虚拟变量的矩阵。因此,两个分类变量的标准化检验统计量对应于检验统计量。如果一个变量是数字变量,而另一个变量是分类变量,您将获得 ANOVA 类型的检验。其他转换也是可能的,适用于审查生存响应或有序响应等。g()h()χ2

如果您想“手动”执行测试,您可以探索包中的independence_test()功能以coin进行条件推理。Hothorn 等人的“A Lego System for Conditional Inference” ( doi:10.1198/000313006X118430 ) 中提供了介绍,其预印本版本也可在vignette("LegoCondInf", package = "coin").