如何处理分析可选调查数据

数据挖掘 统计数据 数据
2021-09-20 17:49:52

考虑这种情况。有一个网站对每种三明治进行排名。对于每种类型的三明治,用户都会填写一份关于以下内容的调查:A)它的美味程度(从 1 到 5 分);B) 填充程度(从 1 到 5);C*) 如果是辣的(-1 或 1)。

该网站显示问题 A 答案的平均值、问题 B 答案的平均值以及问题 C 答案的总和。

问题 A 和问题 B 为必填项。然而,问题 C 是可选的。我有每个三明治的用户提交评分的数量,我有 C 答案的总和。

我想比较不同三明治的辣度。由于不同的三明治有不同的排名,我不能简单地比较问题 C 的答案总和。我也不能将其加权为“问题 C 的答案总和/评分数”,因为问题 C 是可选的,有些人不会回答它。

在这些限制下比较不同三明治的辣度的最佳方法是什么?

1个回答

你最好的办法是改变你提出问题 C 的方式和衡量它的方式。对 C 给出是/否响应不会让您衡量实际的辣度,因此您需要将其调整到一个比例并允许个人对其进行排名。虽然你所有的问题都是相当主观的,但 C 是最主观的,因为对香料的耐受性在一个人是否认为它辛辣方面起着重要作用。

我建议使用 1-5 等级,就像你对其他等级一样,并为等级的每个级别提供比较建议,例如 1 是吃面包,而 5 相当于吃哈布内罗辣椒。