假设我们有 30 个特征(输入),每个特征都可能影响结果(输出)。我们尝试使用从特征到目标的可用(“观察到的”)映射来开发仅使用某些特征的预测模型。每个特征都可以包含在模型的输入中,也可以不包含。这意味着我们总共可以2^30组合使用哪些参数。我想注意模型是固定的,我不会更改模型(广义上),我只是决定使用哪些变量。
现在我们已经考虑了几千种组合,并且对于每种组合,我们都有一个衡量它有多好的度量(当然,我们使用测试集)。例如,我们知道如果我们取变量 1、7、13 和 27,我们会得到一个等于 123.456 的误差(模型的准确性)。如果我们使用变量 3、4、10、11、13、27 和 29。我们得到一个等于 23.456 的错误。
我的问题是:如何将模型性能的知识总结为所用参数的函数?
换句话说,我需要一个描述模型性能的“元模型”。我需要这个,因为我想利用获得的知识更智能地搜索潜在模型的巨大空间。
更具体地说,我有一个从 N 个二进制向量到实数(浮点)值的映射。每个二进制向量表示是否使用了相应的变量,实际输出描述了相应模型的性能。现在我想用这个“元数据”来训练一个“元模型”。但在我开始“元训练”之前,我想决定哪种模型适合训练。该模型应捕获诸如“存储在变量中的信息”之类的概念。例如,我可以想象变量 7 对变量 3 和 5 的组合没有附加信息。或者,我们可以拥有“独立”覆盖目标空间的“正交”变量。