最适合您的应用的开箱即用的 2 类分类器是什么?

机器算法验证 机器学习 分类 应用
2022-02-09 06:29:38

规则:

  • 每个答案一个分类器
  • 如果您同意,请投票
  • 否决/删除重复项。
  • 将您的应用程序放在评论中
4个回答

随机森林

  • 轻松捕捉复杂的结构/非线性关系
  • 变量尺度不变
  • 无需为分类预测变量创建虚拟变量
  • 变量选择不是很需要
  • 相对难以过拟合

逻辑回归

  • 在大多数数据集上快速且表现良好
  • 几乎没有要调整的参数
  • 处理离散/连续特征
  • 模型易于解释
  • (不限于二进制分类)

支持向量机

带有噪声数据的监督问题的正则化判别式

  1. 计算效率高
  2. 对数据中的噪声和异常值具有鲁棒性
  3. 线性判别 (LD) 和二次判别 (QD) 分类器都可以从相同的实现中获得,将 LD 分类器的正则化参数设置为“[1 0]”,将正则化参数设置为“[0 0]” QD 分类器 - 对于参考目的非常有用。
  4. 模型易于解释和导出
  5. 适用于类协方差矩阵可能没有很好定义的稀疏和“宽”数据集。
  6. 通过将 softmax 函数应用于每个类的判别值,可以为每个样本估计后验类概率的估计。

链接到弗里德曼等人1989 年 原始论文。此外,Kuncheva 在她的“组合模式分类器”一书中有很好的解释