数据挖掘 - 如何将 scikit 指标用于 statsmodel，反之亦然？ - 吾爱随笔录

正在研究 5K 记录的二进制分类问题。标签 1 是 1554，标签 0 是 3558。

我确实参考了这篇文章，但不确定它现在是否已更新或任何人有任何方法来计算此指标

目前我使用如下所示的logit模型

model = smm.Logit(y_train, X_train_std)
result=model.fit()
y_pred = result.predict(X_test_std)
print("Accuracy is ", accuracy_score(X_test_std, y_pred))  #throws error from here and all the line below
print(classification_report(X_test_std, y_pred))
print("ACU score is ",roc_auc_score(X_test_std, y_pred))
print("Recall score is",recall_score(X_test_std,y_pred))
print("Precision score is",precision_score(X_test_std,y_pred))
print("F1 score is",f1_score(X_test_std,y_pred))

我尝试这样做的原因是因为 statsmodel 有p-values,coeff等intervals，我希望通过scikit metrics如上所示的常规指标，但它不被接受。

另一方面，通过scikit logistic regression我可以得到usual metricsand coeff，但是p-values,conf intervals呢？反正有没有做相反的事情？

有人可以帮我弄这个吗？