我试图根据历史交易预测客户何时购买产品(一年中的哪个月)。我有 3 年的交易数据,很多客户都是常客。或者基本上想要挖掘历史交易数据,并查看一组客户(在地理/客户类型等中)哪些月份可能是购买产品 X 的时期。
有人可以建议在这种情况下哪种机器学习技术或统计方法最好。
我正在尝试 - 以月份为预测变量的决策树分类/逻辑回归模型。- 统计分析,看看哪个月份对一组客户更重要。
我试图根据历史交易预测客户何时购买产品(一年中的哪个月)。我有 3 年的交易数据,很多客户都是常客。或者基本上想要挖掘历史交易数据,并查看一组客户(在地理/客户类型等中)哪些月份可能是购买产品 X 的时期。
有人可以建议在这种情况下哪种机器学习技术或统计方法最好。
我正在尝试 - 以月份为预测变量的决策树分类/逻辑回归模型。- 统计分析,看看哪个月份对一组客户更重要。
我会尝试使用 xgboost 分类器。就我而言,xgboost 的表现优于随机森林。
import xgboost as xgb
xgb_model = xgb.XGBClassifier(
learning_rate=0.1, n_estimators=1000, max_depth=3, min_child_weight=1,
gamma=0, subsample=0.8, colsample_bytree=0.8, objective='binary:logistic',
nthread=4, scale_pos_weight=1, seed=27)
您可以使用以下代码段来避免过度拟合问题。
xgb_model = xgb_model.fit(X_train, y_train.astype(int), early_stopping_rounds=50,
eval_set=[(X_test, y_test['target'])])