正在研究 5K 记录的二进制分类问题。标签 1 是 1554,标签 0 是 3558。
我确实参考了这篇文章,但不确定它现在是否已更新或任何人有任何方法来计算此指标
目前我使用如下所示的logit模型
model = smm.Logit(y_train, X_train_std)
result=model.fit()
y_pred = result.predict(X_test_std)
print("Accuracy is ", accuracy_score(X_test_std, y_pred)) #throws error from here and all the line below
print(classification_report(X_test_std, y_pred))
print("ACU score is ",roc_auc_score(X_test_std, y_pred))
print("Recall score is",recall_score(X_test_std,y_pred))
print("Precision score is",precision_score(X_test_std,y_pred))
print("F1 score is",f1_score(X_test_std,y_pred))
我尝试这样做的原因是因为 statsmodel 有p-values,coeff等intervals,我希望通过scikit metrics如上所示的常规指标,但它不被接受。
另一方面,通过scikit logistic regression我可以得到usual metricsand coeff,但是p-values,conf intervals呢?反正有没有做相反的事情?
有人可以帮我弄这个吗?