rpart 如何处理预测变量中的缺失值?

机器算法验证 r rpart
2022-03-14 07:58:03

?rpart文档 -

na.action :默认操作删除所有缺少 y 的观测值,但保留缺少一个或多个预测变量的观测值。

它如何估算预测变量中的缺失值?

1个回答

这就是代理变量的来源——对于每个拆分,缺少拆分变量的观察值将根据最佳代理变量进行拆分,如果下一个最佳替代变量缺失,依此类推,详见:

  • Therneau、Terry M. 和 Atkinson Elizabeth J.(2014 年 3 月 28 日)。使用 RPART 例程进行递归分区简介,Mayo Foundation,第 5 节。

该文档可通过rpart帮助 ( pdf ) 访问。