谷歌分析允许我收集关于每个网络会话的数据。为简单起见,我们假设对于每个用户,我们收集每个会话的页面数和在站点上花费的时间:
user_id visit_id page_views time_spent result
1 1 10 100 0
1 2 31 510 0
1 3 1 10 1
您将如何对这些数据建模?我希望ML 算法做什么:
- 尽可能多地提取信息
- 具有灵活数量的输入(例如会话数可以达到无穷大)
我能想到的:
- 聚合每个用户的数据,例如平均 page_views 或总 page_views 并将其输入通用算法,例如随机 forrest(但我会丢失聚合信息)
- 使用 LSTM 并最多提供最后 3 次访问(也会丢失信息,但这会比聚合更好吗?)
目标: 建立一个预测模型来分析所有用户会话并预测该人是否会转换。