我目前正在对一个网站进行分析,该网站要求我创建一个决策树图,显示人们到达网站时可能采取的路线。我正在处理一个data.frame显示所有客户到该站点的路径,从主页开始。例如,客户可以采用以下路径:
Homepage - pg 1
Kitchen Items page - pg 2
Pots and Pans page - pg 3
所以这个客户会有一个 3 页的旅程。我想在 R 中尝试做的是结合所有客户路径,从而为遵循网站上特定路径的客户分配概率。例如,如果我要检查所有路径,我会发现 34% 的到达主页的人会进入“厨房用品页面”。R有这个设施吗?
我通过rpart和partykit包查找了不同的方法,但它们似乎没有任何帮助。
非常感谢任何朝着正确方向前进的方向!