当人们可能出现在多个组中时,正确的统计测试

机器算法验证 假设检验 民意调查 分析
2022-04-18 12:47:49

预先感谢您的帮助。

我进行了一项调查。人们首先回答了一个多项选择问题——他们可以选择任意数量的选项。该问题询问他们访问网站的目的(例如,购买商品、阅读商品评论、比较价格、浏览商品等)。

然后,他们被要求在 1 到 7 之间用数字对实现目标的难易程度进行评分。

我想要做的是确定在这个网站上某些目标在统计上是否更容易/更难。如果目的是相互排斥的,我会很有信心。问题是人们可能选择了多个目标。所以我有x有目的的人1,y目的 2,但我也有目的 1 和 2 的 z,等等。

我想知道的是,是否有一种方法不仅可以考虑一个或另一个类别的人,还可以考虑可能属于多个类别的人。

任何反馈将不胜感激。

1个回答

我假设当用户被要求对网站使用的易用性进行评分时,这是他们的总体印象,每个用户只问一次易用性,而不是针对每项任务。因此,如果我说我使用该网站来更新我的个人资料并发布博客并且我将我的易用性评为 1(可能很难),那么您将不知道更新个人资料或发布博客是否困难,或两者兼而有之。

我通常对这些性质的数据进行两次分析。首先,我定义了一个外积变量,它是对应于每个可能的任务或响应组合的唯一标识符。因此,如果有 3 个用户可能认可的任务,我会23=8可能的组合级别:不支持任何任务、只支持第一个任务、只支持第二个任务、只支持第三个任务、第一个和第二个任务、第一个和第三个任务以及所有任务。有 8 个级别,我们可以检查平均难度等级和错误条形图。如果这会导致许多可能的级别,那么根据结合了报告难度和表示的有意义的指标对这样的错误栏进行排序会很有用。例如,您可能会考虑至少有 5 或 10 个受访者的响应类别,并将它们从最有问题到最没有问题的顺序进行排序,以查看哪些特定任务对用户来说最糟糕。

第二:线性回归模型提供了一种探索类似问题的方法。将轻松视为结果,0/1 指示变量可用于每个可能的任务,以用作模型中的协变量。此外,可以在两个或多个特定任务之间创建产品术语。这导致了一个非常高维的模型,并且可以应用模型选择技术来识别异质性。分两次执行此操作,第一次仅针对主效应,第二次针对乘积项,为流程改进提供了许多有用的假设。