机器算法验证 - 调查数据的卡方检验 - 吾爱随笔录

调查数据的卡方检验

机器算法验证假设检验卡方检验民意调查

2022-04-19 02:07:49

我正在使用一种将调查数据转化为有用统计数据的产品。审查他们的代码，让我有些紧张，而且我不是统计学家，所以我希望我能问清楚以下问题：

在调查 S 中，针对产品 P。受访者在被问及他们是否

喜欢这个产品
无动于衷
讨厌这个产品

受访者分为男性和女性。该软件在处理一些调查数据时提供的图表显示“男性更有可能成为喜欢的人”。或“男人和女人……”或“女人……”

对我来说，这已经引发了问题：

男人比什么更有可能成为喜欢的人？
男人和女人比什么更有可能成为喜欢的人？
这些东西是如何衡量的？
正在使用什么测试？...等。

当我查看代码时，我注意到他们使用的是 chi-test(!)。我不得不问零假设到底是什么，因为这越来越没有意义了。显然，零假设是“男人和女人喜欢的机会是一样的”……好吧，好吧。可是等等。

所以，我们有下表：

                Men       Women      Total
 likers         54        46         100

 indifferent    23        26         49

 non-likers     22        31         53

 Total          99        103        202

我们可以填充所有三行的预期分布：

                Men          Women      Total
 likers         54-49        46-50      100

 indifferent    23-24        26-24      49

 non-likers     22-25        31-27      53

 Total          99           103        202

然后，代码根据上述内容使用 chi 值填充矩阵。程序员决定进行这些计算时的自由度是 (m-1)(n-1) = 2，这让我认为零假设是，如果你是一个喜欢的人、冷漠的人或不喜欢的人喜欢，你是男人或女人的概率是相等的。

我们使用的是 90% 的置信水平，所以我想我们需要做的就是将所有 6 个 chi 值相加，并将其与自由度和置信区间给出的临界值进行比较。从那时起，我们可以 90% 肯定地说，男性和女性同样可能是一个喜欢的人，等等……或者拒绝 NH

这就是代码的作用：

它使用 1 个自由度而不是 2 个（仍然是 90%），所以我们有一个新的临界值 2.706
对于 chi 值矩阵的每一行（liker 等），如果元素大于临界值，则拒绝原假设，并将元素添加到“显着性”列表中。

为了说明，它查看 [likers;men] > cv 即 chi_value[0][0] > cv，如果这是真的，则拒绝 NH，并将 'men' 添加到列表中。

在图表上，这一结果反映为：男性更有可能成为喜欢的人。对我来说，对每一行男性和女性的单一评估似乎是错误的。当你只看一个变量时，就两个变量发表声明是没有意义的......

我不像我的老板那么聪明，但我觉得这里出了点问题，如果有人能帮助澄清这一点，我将不胜感激。

最后，客户要求知道男性比女性更有可能成为喜欢的人的百分比——我认为这是一个错误的要求，因为卡方检验不能解决更大或更小的问题，而只是用来确认一组变量是独立的。我对吗？

我只想补充一点，我使用以下语句来指导我的思考：

注意事项请记住，卡方检验仅测试两个变量是否独立，这一点很重要。它不能解决哪个更大或更小的问题。使用卡方检验，我们不能直接评估男性比女孩更喜欢这个假设；相反，测试（严格来说）只能测试Like和Gender这两个变量是否独立。

2个回答

“这就是代码所做的”之后的部分似乎不正确，尽管很难说。

客户的要求是合理的。卡方没有回答，但它仍然是一个合理的要求。喜欢它的男性比例为 54/99 = 约 54%，女性为 46/103 = 约 46%（您可以计算出确切值），因此差异约为 8%。

这里报告的卡方有两个变量：喜欢和性别。具体来说，它查看它们是否相关联。鉴于一个变量是有序的，因此有比常规卡方更强大的检验。

您似乎首先使用 2 df 进行综合测试（独立性卡方检验），以确定“相似状态”和“性别”是否独立。然后您正在对各个行进行事后测试（卡方拟合优度测试），以查看男性/女性在每行下的可能性是否相同。根据“事后跟进测试”部分下的此链接，这些事后测试是允许的。每行将生成一个具有 1 df 的卡方检验。例如，他们会针对每一行测试“何：男性和女性‘喜欢’的比率相同”。

但是，我很怀疑没有对多重比较进行调整。由于您似乎正在执行这 1 个 df 测试中的三个，因此您应该调整您的以纠正家庭错误率（例如 Bonferroni 校正）。 $\alpha$

如果您的客户想知道男性成为“喜欢者”的可能性有多大，等等，您可以 (a) 根据 Peter Flom 建议的数据提供点估计，或者 (b) 您可以为如果要进行区间估计，请计算两个比例之间的差异。除了差异显着（或不显着）的声明外，我的猜测是点估计对您的客户来说就足够了。

除了不控制家庭错误率的问题外，我的分析似乎已经足够了。我希望这有帮助。

其它你可能感兴趣的问题

上一篇双变量正态的条件抽样下一篇如何处理大数据相似度计算？