我有一个关于缺失值估算的问题。支持向量机不适用于缺失值,因此在实践中我因此 na.omit 任何参数(例如 X1 到 X10)上具有缺失值的行/案例。从理论的角度来看,如果一个人通过基于例如多元回归、SVM 对剩余参数的 SVM 预测该参数的缺失值来为一个缺失参数(比如说 X1)的值估算缺失值,那么可以提高整体分类性能(例如 X2-X10)?提出这个问题,因为实践中的表现常常令人失望,因此想知道是否有理论上的原因说明我的上述方法可能是无稽之谈/无用。
以类似的方式 - 由于决策树确实可以处理缺失值,因此应该使用现有数据集的全部信息,我是否正确地假设在这种情况下,从理论的角度来看,绝对没有增值/收益通过使用其他输入参数来估算缺失值?