假设我有一个简单的机器学习问题,比如分类。凭借视觉或音频识别方面的一些基准,作为人类,我是一个非常好的分类器。因此,我对分类器的性能有一个直觉。
但是有很多数据,有一点是我不知道我训练的分类器可以得到多好。这是我个人不是一个很好的分类器的数据(例如,从 EEG 数据中对一个人的情绪进行分类)。对我的问题有多难有一个直觉是不可能的。
现在,如果我遇到机器学习问题,我想知道我能做到多好。有什么原则性的方法吗?你会怎么做?
可视化数据?从简单的模型开始?从非常复杂的模型开始,看看我是否可以过拟合?如果你想回答这个问题,你在寻找什么?你什么时候停止尝试?