最近我一直在尝试更多地了解在线学习(这绝对令人着迷!),而我无法很好地掌握的一个主题是如何考虑离线与在线环境中的模型选择。具体来说,假设我们基于一些固定数据集离线训练分类器例如,我们通过交叉验证来估计它的性能特征,然后我们以这种方式选择最好的分类器。
这就是我一直在思考的问题:那么,我们如何着手将应用到在线环境中呢?我们可以假设离线找到的最好的也可以作为在线分类器表现良好吗?是否有意义,然后采用相同的分类器上的相同参数在在线设置中“操作”它,还是另一种方法更好?在这些情况下有什么注意事项?这里的主要结果是什么?等等。
无论如何,现在已经有了,我想我正在寻找一些可以帮助我(希望还有其他人,他们一直在考虑这种事情!)的参考资料或资源,从仅以离线方式思考转变,并且随着阅读的进行,发展思维框架,以更连贯的方式思考模型选择问题和这些问题。