周期预测模型

数据挖掘 预测建模
2022-03-11 09:30:41

我还不确定如何将这个问题清楚地表述为机器学习任务。所以希望各位大佬能进来帮帮我。

问题:通过查看客户在第 n 周的行为来预测某人是否会在第 n+2 周的办公时间拿起电话

数据:我有大约 3 个月的通话记录,这是在客户级别汇总的。各种属性包括呼叫次数、呼叫持续时间、呼叫时间、数据流量。但是,当然,这些主要属性进一步分为大约 20 个属性。

当前方法(非常手动):我查看第 n+2 周的数据,并获取在办公时间(通话时间 > 5 秒和通话时间)拿起电话的一组人。这是目标组,T。
我查看第 n 周的数据并手动尝试所有可能的属性组合以尽可能接近 T。但是一段时间后手动尝试似乎很累。基线当然使用与第 n+2 周相同的条件。但整个想法将是增加这个数字。

问题:有什么方法可以转换此数据集,以便我能够将其作为机器学习任务完成?

1个回答

您可以尝试构建某种“滑动窗口表”。假设您具有以下属性:

  • 通话时长 (x1)
  • 通话时间 (x2)
  • 接电话 (x3)

让我们进一步假设您有过去 3 周的数据,这允许我们设置下表。行包含单独的调用,列包含属性。附录_1 告诉我们时间。例如,x1_1 是前一周的通话时间,x2_2 是两周前的通话时间,等等。

客户 | x1_1 | x2_1 | x3_1 | x1_2 | x2_2 | x3_2 | ... | x3_3

您可以使用历史数据训练您的模型,其中 x3_3 是上周的数据。然后,您将向模型提供当前数据(_3 是当前周*)并尝试预测 x3_3 - 客户是否会选择电话。

*我假设你知道你要打电话给谁,因此你有_3个属性,但你还不知道他们是否回应

目的是让模型有机会学习时间依赖性 - 可能一周前的通话时间以及通话时间与未来再次拿起电话的机会密切相关。

还可以帮助执行特征选择。假设是某些属性与其他属性密切相关,而其他属性则不是。您可以简单地使用 x1_1、x2_1 并查看与 x3_1 的关系。但我建议经常重新计算这些,因为偏好可能会及时改变。