时间序列分析与线性回归

数据挖掘 机器学习 深度学习 时间序列 逻辑回归 线性回归
2022-03-15 11:42:26

我正在开发一种算法来预测餐厅未来的客流量。我混淆了这两者中的哪一个:线性回归或时间序列分析我应该用作我的算法的基础。我正在使用的功能是:日期,是否有节日,温度,气候条件,当前评分,是否有假期,服务评分,评论数量等。

请指导我应该如何进行。另外,我该如何优化我的算法,以便它可以随着时间的推移而学习。

3个回答

您拥有的数据是面板数据,它是横截面数据和时间序列的组合。

您可以通过为数据提供时间戳来尝试回归模型。就像根据您的工作日(1 到 7)维护一个特征。或者如果您的数据中有趋势和季节性,您可以将周数作为特征(0 到53) 周。

你为什么不两个都试试?在您的测试和交叉验证集中测试方法的准确性。使用学习曲线相关技术得出实验性的逻辑结论。请记住,这是数据“科学”!

我认为线性回归在这里比时间序列分析更可行,因为我认为你有很多分类变量,时间序列分析更适用于纯数字数据。

您的许多分类变量可能是 NA,并且许多可能具有高基数,因此可能不适合单热编码。所以你必须选择一种算法,它可以很好地处理 NA 值,并且可以处理许多独特的分类变量变成指标变量。您也可以通过适当的预处理来处理这个问题。

此外,您没有告诉使用您的数据集是否具有次日(例如每小时)或每日分辨率。我认为每天的分辨率太粗糙(天气可能每天变化几次),客人到达的高峰可能在早上或晚上。因此,当您想要确定周期性(例如,大多数餐厅的工作日可能以小时为单位)时,时间序列分析会大放异彩,但您的变量似乎在日常水平上且难以预测。