房价预测是回归问题还是时间序列问题?

机器算法验证 回归 时间序列 Python
2022-03-25 11:52:15

我有一个美国几个城市从 2000 年到 2016 年的房价数据集。由此我想预测当前日期类似房屋的价格,这是作为回归问题还是时间序列问题更好地解决。重要的一点是,我现在拥有的数据相当稀疏,只有几千条记录。

3个回答

虽然另一个答案是正确的,但响应变量可以建模为线性回归 - 您正在处理房价。因此,您的数据集可能会遭受所谓的时间序列诱导的异方差性

这基本上意味着,由于您的房屋会因年龄而异 - 即有些房屋可能有一年的历史,而其他房屋可能超过 30 年,那么您的残差就会出现不恒定的变化。

如果您看到这篇题为“Heteroscedasticity in hedonic house price models”的摘要,您会注意到使用广义最小二乘法可以消除通过标准普通最小二乘法获得的具有较低标准差的预测误差的异方差性。

总结您的问题,您的数据可以使用回归分析进行建模,但您确实需要注意异方差性和序列相关性。此外,您可能会发现您的分布(运行 qqPlot 进行检查)可能不正常,通过首先使用 Box-Cox 变换将数据转换为正态分布,您的分析可能会更好。

您无需选择其中之一。价格可以建模为它自己的过去值和自变量的函数。后者本身可能具有滞后值,这也有助于预测价格。

您的响应变量 - 房价和预测变量 - 年份、城市。我对此是否正确?您可以将其建模为线性回归并预测房价。