我的系统上有用户活动日志。这是一个CMS系统。
日志包括:
- 用户身份
- 执行的操作(110 种可能的操作之一 - 诸如页面编辑、页面读取、登录等)
- 已执行站点操作(与所有可能的操作无关)
- 对(文档名称或文档 ID - 与所有可能的操作不相关)执行了对象操作
- 执行操作的日期和时间
我想使用这些数据将用户分组到具有相似行为的组中,这样我就可以调查这些组以找出他们是谁,然后通过培训干预、新闻通讯等来定位他们。
我需要帮助将上面的事物列表转换为集群。
我可以使用哪些技术从上述数据生成矩阵,然后将其输入 K-Means 聚类算法?
我尝试按用户计算操作并使用它来提供集群算法,但结果没有用。我还尝试将站点和文档 ID 视为文本,对其进行特征散列并将其输入到 K-Means 集群模型中,也得到了无用的数据。