我正在制作一个随机森林分类器来确定一个句子是“正面”(1)、“负面”(-1)还是“中性”(0)。
然而,我更喜欢假阴性而不是假阳性,也就是说,我更喜欢说一个句子是中性的,即使它不是在它是中性的时候说一个句子是肯定的,如果它是否定的更是如此。
所以我使用predict_proba, 类似于:
def my_pred(rfc, X, weight=0.5):
res = rfc.predict_proba(X)
if res[0]>weight: return -1
elif res[2]>weight: return 1
return 0
但我想知道我是否可以使用class_weight?会更好吗?
