我正在使用一种将调查数据转化为有用统计数据的产品。审查他们的代码,让我有些紧张,而且我不是统计学家,所以我希望我能问清楚以下问题:
在调查 S 中,针对产品 P。受访者在被问及他们是否
- 喜欢这个产品
- 无动于衷
- 讨厌这个产品
受访者分为男性和女性。该软件在处理一些调查数据时提供的图表显示“男性更有可能成为喜欢的人”。或“男人和女人……”或“女人……”
对我来说,这已经引发了问题:
- 男人比什么更有可能成为喜欢的人?
- 男人和女人比什么更有可能成为喜欢的人?
- 这些东西是如何衡量的?
- 正在使用什么测试?...等。
当我查看代码时,我注意到他们使用的是 chi-test(!)。我不得不问零假设到底是什么,因为这越来越没有意义了。显然,零假设是“男人和女人喜欢的机会是一样的”……好吧,好吧。可是等等。
所以,我们有下表:
Men Women Total
likers 54 46 100
indifferent 23 26 49
non-likers 22 31 53
Total 99 103 202
我们可以填充所有三行的预期分布:
Men Women Total
likers 54-49 46-50 100
indifferent 23-24 26-24 49
non-likers 22-25 31-27 53
Total 99 103 202
然后,代码根据上述内容使用 chi 值填充矩阵。程序员决定进行这些计算时的自由度是 (m-1)(n-1) = 2,这让我认为零假设是,如果你是一个喜欢的人、冷漠的人或不喜欢的人喜欢,你是男人或女人的概率是相等的。
我们使用的是 90% 的置信水平,所以我想我们需要做的就是将所有 6 个 chi 值相加,并将其与自由度和置信区间给出的临界值进行比较。从那时起,我们可以 90% 肯定地说,男性和女性同样可能是一个喜欢的人,等等……或者拒绝 NH
这就是代码的作用:
- 它使用 1 个自由度而不是 2 个(仍然是 90%),所以我们有一个新的临界值 2.706
- 对于 chi 值矩阵的每一行(liker 等),如果元素大于临界值,则拒绝原假设,并将元素添加到“显着性”列表中。
为了说明,它查看 [likers;men] > cv 即 chi_value[0][0] > cv,如果这是真的,则拒绝 NH,并将 'men' 添加到列表中。
在图表上,这一结果反映为:男性更有可能成为喜欢的人。对我来说,对每一行男性和女性的单一评估似乎是错误的。当你只看一个变量时,就两个变量发表声明是没有意义的......
我不像我的老板那么聪明,但我觉得这里出了点问题,如果有人能帮助澄清这一点,我将不胜感激。
最后,客户要求知道男性比女性更有可能成为喜欢的人的百分比——我认为这是一个错误的要求,因为卡方检验不能解决更大或更小的问题,而只是用来确认一组变量是独立的。我对吗?
我只想补充一点,我使用以下语句来指导我的思考:
注意事项 请记住,卡方检验仅测试两个变量是否独立,这一点很重要。它不能解决哪个更大或更小的问题。使用卡方检验,我们不能直接评估男性比女孩更喜欢这个假设;相反,测试(严格来说)只能测试Like和Gender这两个变量是否独立。