我正在尝试用 13 个属性对大约 400K 数据进行分类。我用过python sklearn的SVM包,但是没用,后来才知道SVM不适合大数据集分类。然后我使用以下 MLPClassifier 使用 (sklearn) ANN:
MLPClassifier(solver='adam', alpha=1e-5, random_state=1,activation='relu', max_iter=500)
并使用 200K 样本训练系统,并在剩余样本上测试模型。分类效果很好。但是,我担心的是系统过度训练或过度拟合。您能否指导我了解隐藏层的数量和节点大小以确保没有过度拟合?(我了解到默认实现有 100 个隐藏神经元。按原样使用默认实现可以吗?)