我有一个数据集,其中包括加利福尼亚不同城市的一组客户、每个客户的呼叫时间以及呼叫状态(如果客户接听电话则为 True,如果客户不接听电话则为 False)。
我必须找到一个合适的时间给未来的客户打电话,这样接听电话的可能性就很高。那么,解决这个问题的最佳策略是什么?我是否应该将其视为一个分类问题,其中小时 (0,1,2,... 23) 是类?还是我应该将其视为时间是连续变量的回归任务?如何确保接听电话的概率很高?
任何帮助,将不胜感激。如果您向我推荐类似的问题,那也很棒。
下面是数据的快照。