对于可能是一个非常基本的问题,请提前道歉。
我有一个由对不同客户的营销电话组成的数据集,其中包括电话的时间戳。我的目标是训练一个模型来预测客户是否会根据通话时间以及其他功能(如来电显示等)来接听或忽略它。
问题是调用的结果显然是时间相关的,也就是说,每个客户端的数据点顺序对于在给定时间预测因变量很重要。
我的问题是,如何转换我的特征,以便可以使用标准分类算法(如逻辑回归/随机森林)对新数据点进行分类?这些算法对这些场景有效吗?如果是这样,我应该如何继续考虑以前的数据点?
我已经读过时间序列数据可以通过包括因变量的超前列和滞后列来转换为监督学习问题。但由于我的测试数据没有这些列,我对它们如何帮助我感到困惑。
非常感谢你。