我仍然对我的分析没有信心,我真的很困惑,什么可能是模拟此类问题的最佳方法。
在此先感谢您的帮助。
我仍然对我的分析没有信心,我真的很困惑,什么可能是模拟此类问题的最佳方法。
在此先感谢您的帮助。
问题是您是否真的想将此视为时间序列问题。我这样说是因为可能没有明显/持久的自相关(意味着取决于)。
我的看法(不知道数据)是除了星级之外,每家酒店都有自己未观察到的“身份”(如位置、声誉等)。预订(以及价格)也可能高度依赖于时间。因此,您可以尝试使用固定效应模型。这个想法是你以如下方式建模:
在哪里观察酒店特色,是酒店固定效应(即每家酒店一个指标/虚拟变量),是时间(一年中的某天左右),并且是误差项。
在模型解释方面,是重要的(标准混杂因素),其中不是那么相关(在有限元回归中经常被忽略),因为只是“每家酒店一次拦截”。如果您对时间方面的建模感兴趣,那么巧妙的编码是关键。在不知道数据的情况下,很难说出这如何解决。有两种通用选项,a)虚拟编码(每个时间步长一个虚拟/指标)或连续处理(日历日?),可能带有滞后成分(昨天的价格)。在后一种情况下,您将朝着动态面板的方向前进,这可能有点挑战性。
您可以先尝试 OLS,因为它在计算方面非常有效。为了获得更好的拟合效果,您还可以尝试提升,例如基于LightGBM. 这是一个促进回归的最小示例(但没有固定效应模型,只是一个正常的模型)。