如何表示没有流失训练数据的用户

数据挖掘 喀拉斯 搅拌
2022-02-27 01:29:45

我正在使用包含一堆变量的示例数据构建一个文件:

date, customer_id, amount_spent, number_of_transactions,time_since_last_transaction等等,我正在映射days_to_churn

我将使用 Keras 训练我的模型,将加粗变量映射到斜体days_to_churn但是,在许多情况下,用户是活动订阅者并且此值为空白。

我将如何结合这一点来确保我不会将活跃的人排除在我的流失计算之外?

1个回答

在您的设置中,唯一的方法可能是将其设置为某个较大的数字,例如 365。但是,这将迫使您丢弃所有小于 365 天的日期,因为您不能确定客户不会在他达到 365 天之前流失(这还在未来)。

更好和更常见的方法是在滚动窗口的基础上查看客户流失情况,例如客户在接下来的 30 天内是否会流失。这会将您的问题变成分类问题。这样,您只需丢弃最近 30 天的数据。