我有一个包含 25k 用户的大型 .CSV 数据库,其中包含过去 6 周最后一个用户的活动和事件的各种属性
这是一个数据示例:
username (B) (C) (D) (E)
nicole 524 329 203 787
asteria 197 186 286 120
我想根据每个用户的属性值创建一个共同的行为模式,并运行一个算法来找到一个定义该组行为的共同模式,并找出维度值中是否存在任何相关性以及哪个维度定义了这个用户列表。我完全意识到相关性并不一定等于因果关系。
现在我看到了摆在我面前的几个挑战,非常感谢其他人的一些意见,或者一些很好的资源来寻找更多信息。
这个问题的模型是什么?哪种算法最适合处理这种情况?您推荐使用哪些工具来使用该项目?
任何想法都会很棒。