我想了解选择机器学习算法的标准,即在哪种情况下选择哪种算法的准则是什么?
我知道的原因是:
- 如果我们想建议对 y 变量的影响对任何 x 变量的变化的影响,则选择逻辑回归。
- 随机森林适用于混合数据,对分类数据非常有效。此外,它首先进行特征选择(因此不需要降维)。
- 由于处理时间长,因此不能选择具有高特征和多类别数据的随机森林。
- SVM 可以很好地处理紧密放置的数据点,例如在狗与猫的图像处理识别中。
但是这些不足以选择任何人,因为我没有任何理由不选择哪种算法,例如何时选择 SVM 而不是 Logistic 回归或 RF 而不是 Logistic 回归。
我唯一的理由是性能,所以我运行所有算法以及我选择的表现最好的算法(但这不是正确的方法)。