在尝试模型之前,我试图了解哪种模型可能适用于给定问题,但我发现这种情况不符合我的知识。请指导我所缺少的。我是数据科学的新手。
现在您可以看到边界非常重叠。SVM 的理论表明,该模型可能最适用于重叠的非线性数据,但似乎并非如此。
但它仍然能够识别测试集中的所有数据。那么你能否提供一些关于为什么 SVM 在这方面表现良好的说明。
所以我的最终结果如下:
- 逻辑回归和 SVM 相同(准确度得分:1.0)
- 随机森林(准确度得分:0.9680851063829787)
- KNN(准确度得分:0.925531914893617)
其他详情 :
- 功能集:40
- 样本数据:约 500
