我还不确定如何将这个问题清楚地表述为机器学习任务。所以希望各位大佬能进来帮帮我。
问题:通过查看客户在第 n 周的行为来预测某人是否会在第 n+2 周的办公时间拿起电话。
数据:我有大约 3 个月的通话记录,这是在客户级别汇总的。各种属性包括呼叫次数、呼叫持续时间、呼叫时间、数据流量。但是,当然,这些主要属性进一步分为大约 20 个属性。
当前方法(非常手动):我查看第 n+2 周的数据,并获取在办公时间(通话时间 > 5 秒和通话时间)拿起电话的一组人。这是目标组,T。
我查看第 n 周的数据并手动尝试所有可能的属性组合以尽可能接近 T。但是一段时间后手动尝试似乎很累。基线当然使用与第 n+2 周相同的条件。但整个想法将是增加这个数字。
问题:有什么方法可以转换此数据集,以便我能够将其作为机器学习任务完成?