调查数据的卡方检验

机器算法验证 假设检验 卡方检验 民意调查
2022-04-19 02:07:49

我正在使用一种将调查数据转化为有用统计数据的产品。审查他们的代码,让我有些紧张,而且我不是统计学家,所以我希望我能问清楚以下问题:

在调查 S 中,针对产品 P。受访者在被问及他们是否

  1. 喜欢这个产品
  2. 无动于衷
  3. 讨厌这个产品

受访者分为男性和女性。该软件在处理一些调查数据时提供的图表显示“男性更有可能成为喜欢的人”。或“男人和女人……”或“女人……”

对我来说,这已经引发了问题:

  1. 男人比什么更有可能成为喜欢的人?
  2. 男人和女人比什么更有可能成为喜欢的人?
  3. 这些东西是如何衡量的?
  4. 正在使用什么测试?...等。

当我查看代码时,我注意到他们使用的是 chi-test(!)。我不得不问零假设到底是什么,因为这越来越没有意义了。显然,零假设是“男人和女人喜欢的机会是一样的”……好吧,好吧。可是等等。

所以,我们有下表:

                Men       Women      Total
 likers         54        46         100

 indifferent    23        26         49

 non-likers     22        31         53

 Total          99        103        202

我们可以填充所有三行的预期分布:

                Men          Women      Total
 likers         54-49        46-50      100

 indifferent    23-24        26-24      49

 non-likers     22-25        31-27      53

 Total          99           103        202

然后,代码根据上述内容使用 chi 值填充矩阵。程序员决定进行这些计算时的自由度是 (m-1)(n-1) = 2,这让我认为零假设是,如果你是一个喜欢的人、冷漠的人或不喜欢的人喜欢,你是男人或女人的概率是相等的

我们使用的是 90% 的置信水平,所以我想我们需要做的就是将所有 6 个 chi 值相加,并将其与自由度和置信区间给出的临界值进行比较。从那时起,我们可以 90% 肯定地说,男性和女性同样可能是一个喜欢的人,等等……或者拒绝 NH

这就是代码的作用:

  1. 它使用 1 个自由度而不是 2 个(仍然是 90%),所以我们有一个新的临界值 2.706
  2. 对于 chi 值矩阵的每一行(liker 等),如果元素大于临界值,则拒绝原假设,并将元素添加到“显着性”列表中。

为了说明,它查看 [likers;men] > cv 即 chi_value[0][0] > cv,如果这是真的,则拒绝 NH,并将 'men' 添加到列表中。

在图表上,这一结果反映为:男性更有可能成为喜欢的人对我来说,对每一行男性和女性的单一评估似乎是错误的。当你只看一个变量时,就两个变量发表声明是没有意义的......

我不像我的老板那么聪明,但我觉得这里出了点问题,如果有人能帮助澄清这一点,我将不胜感激。

最后,客户要求知道男性比女性更有可能成为喜欢的人的百分比——我认为这是一个错误的要求,因为卡方检验不能解决更大或更小的问题,而只是用来确认一组变量是独立的。我对吗?

我只想补充一点,我使用以下语句来指导我的思考:

注意事项 请记住,卡方检验仅测试两个变量是否独立,这一点很重要。它不能解决哪个更大或更小的问题。使用卡方检验,我们不能直接评估男性比女孩更喜欢这个假设;相反,测试(严格来说)只能测试Like和Gender这两个变量是否独立。

2个回答

“这就是代码所做的”之后的部分似乎不正确,尽管很难说。

客户的要求是合理的。卡方没有回答,但它仍然是一个合理的要求。喜欢它的男性比例为 54/99 = 约 54%,女性为 46/103 = 约 46%(您可以计算出确切值),因此差异约为 8%。

这里报告的卡方有两个变量:喜欢和性别。具体来说,它查看它们是否相关联。鉴于一个变量是有序的,因此有比常规卡方更强大的检验。

您似乎首先使用 2 df 进行综合测试(独立性卡方检验),以确定“相似状态”和“性别”是否独立。然后您正在对各个行进行事后测试(卡方拟合优度测试),以查看男性/女性在每行下的可能性是否相同。根据“事后跟进测试”部分下的此链接,这些事后测试是允许的。每行将生成一个具有 1 df 的卡方检验。例如,他们会针对每一行测试“何:男性和女性‘喜欢’的比率相同”。

但是,我很怀疑没有对多重比较进行调整。由于您似乎正在执行这 1 个 df 测试中的三个,因此您应该调整您的以纠正家庭错误率(例如 Bonferroni 校正)。α

如果您的客户想知道男性成为“喜欢者”的可能性有多大,等等,您可以 (a) 根据 Peter Flom 建议的数据提供点估计,或者 (b) 您可以为如果要进行区间估计,请计算两个比例之间的差异。除了差异显着(或不显着)的声明外,我的猜测是点估计对您的客户来说就足够了。

除了不控制家庭错误率的问题外,我的分析似乎已经足够了。我希望这有帮助。