我正在尝试构建一个二进制分类器。我已经尝试过具有各种不同结构和参数的深度神经网络,但我没有比这更好的了
Train set accuracy : 0.70102
Test set accuracy : 0.70001
然后我尝试了机器学习算法,如 KNN 和决策树等。我发现Scikit-learn的随机森林分类器n_estimators=100
给了我
Train set accuracy : 1.0
Test set accuracy : 0.924068
我尝试调整其他参数如max_depth
,criterion
但训练集准确率的下降也导致测试集准确率下降。喜欢
Train set accuracy : 0.82002
Test set accuracy : 0.75222
我的问题是,这是
Train set accuracy : 1.0
Test set accuracy : 0.924068
可以接受吗?即使模型过度拟合,测试集的准确性也更好。