数据挖掘 - 如何处理分析可选调查数据 - 吾爱随笔录

考虑这种情况。有一个网站对每种三明治进行排名。对于每种类型的三明治，用户都会填写一份关于以下内容的调查：A）它的美味程度（从 1 到 5 分）；B) 填充程度（从 1 到 5）；C*) 如果是辣的（-1 或 1）。

该网站显示问题 A 答案的平均值、问题 B 答案的平均值以及问题 C 答案的总和。

问题 A 和问题 B 为必填项。然而，问题 C 是可选的。我有每个三明治的用户提交评分的数量，我有 C 答案的总和。

我想比较不同三明治的辣度。由于不同的三明治有不同的排名，我不能简单地比较问题 C 的答案总和。我也不能将其加权为“问题 C 的答案总和/评分数”，因为问题 C 是可选的，有些人不会回答它。

在这些限制下比较不同三明治的辣度的最佳方法是什么？