从一组序列中查找平均序列

数据挖掘 聚类 顺序
2022-03-06 12:36:22

我有一组用户会话。会话由用户执行的操作类型的有序列表组成(例如,买枪、执行任务等)。我想创建/计算与所有提供的会话最相似的会话(用户按顺序执行的最常见的操作类型)

不幸的是,我对数据科学一无所知,但我试图用谷歌搜索一种方法来做到这一点。我找到了这个文件:https ://cran.r-project.org/web/packages/TraMineR/vignettes/TraMineR-state-sequence.pdf 它看起来像 9.1 和 9.2 描述的东西类似于我想要的东西。但我不确定这一点,即使这是真的,我仍然不知道如何在我的场景中使用它。

1个回答

一种方法是不要将其视为每次会话的计算。大多数数据科学解决方案都喜欢以数字、概率或分类结尾。我建议您以不同的方式构建您的数据,以便您尝试回答这个问题 - 考虑到最后一个动作,下一步可能会采取什么行动。

为此,您必须重新构建会话数据并使用所有会话中的信息。例如,如果你比较一个玩家“买枪”的次数,如果是这样,那么记录所有这些会话他们的下一步行动是什么,例如,在 60% 的情况下,他们接下来会“执行任务”。然后,您将根据玩家在所有这些会话中做出的选择数量确定他们下一步行动的概率。

一旦你有了这些概率,你就可以回答这个问题,“接下来会发生什么?”。反过来,这将使您能够通过逐步完成一个会话并通过最可能的下一步构建它来构建您所追求的最普通的会话。