我有一个 scikit learn RandomForestClassifier,它返回 0 和 1:
X = [ [2,1,1,1], [2,0,2,1], [3,1,1,1] , [3,1,1,1], [3,1,1,1] ]
y = [ 0, 1, 1, 1, 1 ]
rf = RandomForestClassifier(n_estimators=200, max_depth=5)
rf.fit(X, y)
X_test = [ [2, 0, 1, 0], [2,1,1,1] , [3,1,1,1] ]
y_result = rf.predict(X_test)
我可以重新运行分类器并获取概率而不是替换为的值
y_result = rf.predict_proba(X_test)
但是我怎样才能从 scikit 中学习结果和概率呢?
如果我不能在同一次运行中得到两个结果,那么运行概率并有一个阈值(比如 0.7)是否有意义,如果概率大于阈值,那么结果是 1?