在机器学习中,我们通常会尝试多种不同特征的组合、我们应用于数据的过滤器、特征或目标变量的转换以及不同版本的超参数。
如果我们没有详尽地了解我们如何跟踪我们尝试的不同组合,那么这个事实就很难跟踪哪些有效,哪些无效。
我想知道是否有围绕这个问题的最佳实践。我目前的方法是跟踪不同的组合命名文件,并参考组成它的部分,例如我将命名它的超参数泡菜文件booster_params_{}_{}_{}_{}.pickle'.format(filter_name, features_name, model_target, params_iteration)
其中过滤器名称是我应用于数据的过滤器集,特征名称是指使用的特征集,模型目标是我正在建模的目标,参数迭代是指超参数的版本。
这似乎是一种矫枉过正,这就是为什么我正在寻找如何解决这个问题的想法。