我想开发一个随机森林分类器模型来预测客户是否会在 7 天后转换。该模型每周重新训练一次,并对下一周进行预测。我使用的功能是使用价值 2 年的客户行为数据创建的。
由于我每周运行一次此模型并生成预测,因此我每周都会为每个客户存储转化预测。此外,我会知道我之前的预测是否正确。
因此,假设我今天在接下来的一周再次训练模型,我想包含以下功能:
last_wk_predictions = Probability of Purchase predicted last week for each customer (between 0 and 1)
did_convert_last_wk = did they convert last week? (0 or 1)
这种方法有特定的名称吗?包括过去的预测是否被视为数据泄漏?