怀疑机器学习算法的比较

数据挖掘 机器学习 表现
2022-02-22 20:52:24

我读了这篇关于机器学习算法比较的文章。

根据这篇文章,有一些特征定义了 ML 模型的性能。我知道有些模型定义了惰性,有些模型定义了渴望。

看文章中的图,可以定义哪些特征定义了模型虽然渴望但懒惰?这个特点是学习速度还是分类速度?

1个回答

免责声明:我没有阅读论文。

  • 这篇文章显然是预印本,即它没有经过同行评审过程,需要在有声望的期刊或会议上发表(或被拒绝)。内容可能是正确的,但没有人检查。
  • 这篇论文是关于一个非常具体的任务“客户端终端设备中网络性能问题的诊断”,实验和结论只适用于这个任务,不能推广到任何机器学习问题。
  • 显示不同学习算法特征的图表更加具体,因为没有衡量这些特征的标准方法。所以作者使用了他们自己的定义,在他们的实验的具体情况下,这可能会或可能不会真正衡量这些特征。从这个数字恕我直言,概括任何东西都是非常冒险的。

请参阅这个关于渴望与懒惰学习的问题。该图显示了与此相关的两个特征是正确的:

  • 学习速度与训练时间有关
  • 分类速度与测试持续时间有关,即应用模型

链接问题中所述,懒惰的学习者只存储训练数据。图中只有kNN是这样的:训练时间短,分类时间长。一个渴望学习者(所有其他人)在训练阶段提取参数,因此它具有更长的训练时间和更短的分类时间。