我有兴趣在点击流数据中对用户进行细分/聚类,并正在寻找一些关于如何去做的好建议。
假设我的数据由网站访问者的观察组成。数据采用点击流/博客格式,因此由用户 cookie 数据组成。假设我可以通过他们的 IP 地址识别唯一用户(作为一个基本示例)。我应该如何准备我的数据,以便可以对其进行细分以找到具有相似行为的用户?我对此的一个想法是,因为数据是事件驱动的,同一个用户显然可以在数据中出现多次,即使它可能都与该用户的同一个会话有关。如何解决这些类型的问题,以便您可以根据用户行为进行细分?
感谢您的建议!