我有一个线性回归问题。简而言之,我有一个数据集,我把它分成两个子集。一个子集用于找到线性回归(训练子集),另一个用于评估它(评估子集)。我的问题是如何在将线性回归应用于数据的评估子集后评估它的结果?
以下是详细信息:
在训练子集中,我进行线性回归:, 在哪里是groundtruth(也称为目标),是一个自变量。然后我发现和. (和在训练子集中给出)。
现在,使用和从上面的训练子集中找到,将它们应用于评估子集,我发现. 换句话说,这些从线性回归中找到. 现在,除了, 我也有从评估集中。我如何评估我的结果(多少与......不同)? 任何通用的数学模型可以做到这一点?它需要是某种数学模型/公式。我可以想出不同的方法来做到这一点,但它们都是临时的或简单的,但这是一项科学工作,所以很遗憾,听起来临时的东西不能在这里使用。
任何的想法?