为价格变动建模 - 应该使用什么分析

数据挖掘 回归 可视化 特征提取 分类数据
2022-02-14 09:10:22

我仍然对我的分析没有信心,我真的很困惑,什么可能是模拟此类问题的最佳方法。

在此先感谢您的帮助。

1个回答

问题是您是否真的想将此视为时间序列问题。我这样说是因为可能没有明显/持久的自相关(意味着y取决于yt1)。

我的看法(不知道数据)是除了星级之外,每家酒店都有自己未观察到的“身份”(如位置、声誉等)。预订(以及价格)也可能高度依赖于时间。因此,您可以尝试使用固定效应模型。这个想法是你以如下方式建模:

y=α+βX+γZ+θt+u.

在哪里X观察酒店特色,Z是酒店固定效应(即每家酒店一个指标/虚拟变量),t是时间(一年中的某天左右),并且u是误差项。

在模型解释方面,X是重要的(标准混杂因素),其中Z不是那么相关(在有限元回归中经常被忽略),因为Z只是“每家酒店一次拦截”。如果您对时间方面的建模感兴趣,那么巧妙的编码t是关键。在不知道数据的情况下,很难说出这如何解决。有两种通用选项,a)虚拟编码(每个时间步长一个虚拟/指标)或连续处理(日历日?),可能带有滞后成分(昨天的价格)。在后一种情况下,您将朝着动态面板的方向前进,这可能有点挑战性。

您可以先尝试 OLS,因为它在计算方面非常有效。为了获得更好的拟合效果,您还可以尝试提升,例如基于LightGBM. 这是一个促进回归的最小示例(但没有固定效应模型,只是一个正常的模型)。