关于处理分类数据中的缺失值,我已经完成了这个。
数据集大约6 categorical columns有missing values. 这将是一个二元分类问题
我看到了不同的方法,一种是使用just leave the missing values in category column as such,另一种是使用from sklearn.preprocessing import Imputer,但不确定哪个是更好的选择。
如果imputing是更好的选择,我可以在应用模型之前使用哪些库,例如LR,Decision Tree, RandomForest.
谢谢!
