我正在用 Python 构建我的模型,以将客户分类为买方/非买方类别。我为这个问题使用了多种算法,然后在评估后选择了最好的。
python 中的 sklearn 包为我提供了所有预测记录的 FPR、TPR 和阈值数组。
在分析 FPR、TPR 和阈值的值时,我对如何解释阈值感到困惑。我得到每条记录的阈值。
例如:我的测试数据集包含 100 条记录,我为 TPR、FPR 和阈值获得了大小为 100 的数组。
如何使用这些值确定我的模型的最佳阈值?
from sklearn import metrics
fpr, tpr,threshold = metrics.roc_curve( Y_test, status[:,1])