我正在执行一项分类任务,并且能够识别重要的预测变量(使用随机森林的重要特征),这些预测变量可以帮助分离类或影响结果。
但我在网上读到prediction models are not causal models。
假设我的预测模型表明这Age是影响结果(死亡)的重要因素之一,我如何证明这Age是导致死亡的原因。
我读到,对模型强预测因子的任何干预/更改都不一定会影响结果。
如何找出真正导致结果变化的因素列表?
目前我所做的是运行一个 RF 模型来识别重要特征并传达这些top 5特征似乎会影响结果。
我如何证明这是因果关系而不仅仅是相关性?