我在我的移动应用上使用 Google Analytics 来查看不同用户如何使用该应用。我根据他们移动到的页面绘制路径。给定一个 100 个用户的路径列表,我该如何对用户进行聚类。使用哪种算法?顺便说一句,我正在考虑使用 sckit learn 包来实现。
我的数据集(在 csv 中)看起来像这样:
DeviceID,Pageid,Time_spent_on_Page,Transition.<br>
ABC,Page1, 3s, 1->2.<br>
ABC,Page2, 2s, 2->4.<br>
ABC,Page4,1s,4->1.<br>
所以路径,这里是1->2->4->1,其中1,2,4是Pageids。