我的问题是如何判断两个回归是否比一个更好地解释数据。
让我举一个更具体的例子(我正在编造,这并不合理)。假设我对收入和幸福之间的关系感兴趣。然后我问很多人他们的收入和幸福感。但是说我问的有些人是男人,有些是女人。现在,我对收入和幸福进行线性回归,发现收入确实根据一些系数预测幸福,这很重要,模型解释了很多方差等。
我的问题是,我如何测试幸福和收入之间是否存在适用于男性和女性的独特关系,或者数据可以通过两个模型更好地解释,每个模型都是通过分别回归男性和女性获得的?
我正在考虑针对每个模型计算数据的残差,然后比较残差的总和,或者类似的东西。这是合理的做法吗?我将如何比较残差?
所以,总而言之,我怎么知道更好的假设是所有数据的唯一线性模型,还是数据的每个子集(先验定义的子集)都有自己的线性模型的假设?