所以,我是 ML 领域的新手,我尝试做一些分类。我的目标是预测体育赛事的结果。我收集了一些历史数据,现在尝试训练分类器。我得到了大约 1200 个样本,其中 0.2 个是我为了测试目的而分离出来的,其他的我用不同的分类器进行网格搜索(包括交叉验证)。到目前为止,我已经尝试过使用线性、rbf 和多项式内核以及随机森林的 SVM。不幸的是,我无法获得显着大于 0.5 的准确度(与随机选择类相同)。这是否意味着我无法预测如此复杂事件的结果?或者我可以获得至少 0.7-0.8 的准确度?如果可行,那么接下来我应该研究什么?
- 获取更多数据?(我最多可以将数据集放大 5 倍)
- 尝试不同的分类器?(逻辑回归、kNN 等)
- 重新评估我的功能集?是否有任何 ML 工具可供分析,哪些特征有意义,哪些没有意义?也许,我应该减少我的功能集(目前我有 12 个功能)?