用于跟踪应用程序内用户活动的功能选择

数据挖掘 特征选择
2021-09-30 10:30:32

我正在开发一个系统,旨在捕获应用程序中用户活动的“上下文”;它是一个框架,Web 应用程序可以使用它来根据对系统的请求来标记用户活动。希望这些数据能够为 ML 功能提供支持,例如上下文感知信息检索。

除了这些用户标签之外,我无法决定选择哪些功能 - 请求的 URL、在任何给定资源上花费的大致时间、估计系统内的当前“活动”。

我很想知道这种技术是否有很好的例子或任何关于该主题的先前研究 - 粗略搜索 ACM DL 发现了一些相关论文,但没有真正发现。

3个回答

好吧,这可能无法彻底回答问题,但是由于您正在处理信息检索,因此它可能会有一些用处。该页面包含一组特征以及与搜索引擎的页面排名方法相关的相关性。作为网页本身的免责声明:

请注意,这些因素并不是搜索引擎用来对网站进行排名的“证据”,而只是显示了排名较高的网页的特征。

所指出的列表可能会让您了解哪些功能可以很好地选择。例如,考虑到第二个最相关的特征,# of google +1's,如果他/她访问许多具有高# of google +1 的页面(推断“用户语境”)。因此,您可以尝试“猜测”一些其他关系,这些关系可能会为您的跟踪应用程序提供有趣的功能。

目标决定了特征,所以我一开始会尽可能多地取,然后使用交叉验证来选择最优子集。

我有根据的猜测是马尔可夫模型会起作用。如果你离散化动作空间(例如,选择这个菜单项、按下那个按钮等),你可以根据过去的动作预测下一个动作。这是一个序列结构化的预测问题。

对于商业产品,搜索应用分析

这些年来,我见过一些类似的系统。我记得一家名为 ClickTrax 的公司,如果我没记错的话,它被谷歌收购了,他们的一些功能现在是谷歌分析的一部分。

他们的目的是营销,但同样的概念也可以应用于用户体验分析。他们系统的美妙之处在于跟踪的内容是由网站管理员定义的——在您的情况下是应用程序开发人员。

我可以想象,作为一名应用程序开发人员,我希望能够看到关于两件事的统计数据——任务完成情况和一般功能使用情况。

作为任务完成的一个例子,我可能有 3 种打印页面的方法 - Ctrl+P、文件->打印和工具栏按钮。我希望能够比较使用情况,看看工具栏按钮使用的屏幕空间是否真的值得。

作为一般功能使用的示例,我想在我的应用程序中定义一组功能,并将我的开发工作集中在扩展最终用户最常使用的功能上。一些可能需要点击 5 次并且很受欢迎的功能,我可能想提供一个热键,或者减少点击次数来激活该功能。还有活动时间。根据应用程序,我可能想知道花费在特定功能上的平均时间。

我想看的另一件事是点击流。在我的应用程序中,人们如何从 A 点到达 B 点?什么是最受欢迎的 B 点?最受欢迎的起点是什么?