房价通胀模型

数据挖掘 机器学习 自然梯度提升
2022-02-21 13:37:00

我有一组房价及其相应特征(房间、平方米等)的数据集。另一个特点是房子的出售日期。目的是创建一个模型,可以估计房子的价格,就好像它今天卖掉了一样。例如,具有一组特定功能(5 个房间,100 平方米)和今天的日期(28-1-2020)的房子,它会卖什么?时间是一个重要组成部分,因为价格会上涨(随着时间的推移而上涨)。我正在努力寻找一种方法将销售日期作为梯度提升模型中的一个特征。

我认为有几种方法:

  1. 将数据转换为整数,并将其作为特征直接包含在模型中。
  2. 创建一个单独的模型来模拟房价随时间的变化。让我们将其视为某种 AR(1) 模型。然后我可以调整所有观察到的通货膨胀,这样我们就可以得到今天的通货膨胀调整价格。这些通货膨胀调整后的价格将在特征集上进行训练。

您对这两个选项有何看法?有没有替代方法?

1个回答

对通货膨胀建模的两种最常见的方法是间接的和直接的。

通货膨胀可以通过将时间作为特征添加到模型中来建模。编码时间最有用的方法是相对月份。数据集中的第一个月可能是 1,第二个月可能是 2,……。然后,该模型可以捕获月份增加对价格的影响。

通货膨胀可以直接建模。该模型可以预测特定时间的价格,然后获取模型的估计价格并通过将其乘以查找的通货膨胀量来调整它以适应今天的美元价值。