我用随机森林拟合了一个带有二进制目标类的数据集。在 python 中,我可以通过 randomforestclassifier 或 randomforestregressor 来完成。
我可以直接从 randomforestclassifier 获得分类,或者我可以先运行 randomforestregressor 并返回一组估计分数(连续值)。然后我可以找到一个截止值来从分数集中推导出预测的类别。两种方法都可以实现相同的目标(即预测测试数据的类别)。
我也可以观察到
randomforestclassifier.predict_proba(X_test)[:,1])
不同于
randomforestregressor.predict(X_test)
所以我只想确认这两种方法都是有效的,那么在随机森林应用中哪一种更好?