我想比较一个样本中单个分类变量的两个百分比。例如,在我的数据集中,一个变量可以取两个值(即 A 和 B)。在 586 个实例中,87.4% 属于 A 类(586 个中的 512 个),12.6% 属于 B 类(586 个中的 74 个)。
- 我可以说“我的参与者往往更关注 A 类而不是 B”吗?
- 是否需要进行统计测试才能提出此类声明?如果是,需要什么统计测试?
我想比较一个样本中单个分类变量的两个百分比。例如,在我的数据集中,一个变量可以取两个值(即 A 和 B)。在 586 个实例中,87.4% 属于 A 类(586 个中的 512 个),12.6% 属于 B 类(586 个中的 74 个)。
您是否有兴趣说其中一个百分比大于另一个?
在你想做的情况下,它们总是加到 100% 吗?
在这种情况下,这很容易——您将其中一个百分比与 50% 进行比较;如果大于 50%,则互补的小于 50%。
如果你想比较还有其他结果的两个比例(比如比较 A 和 B,但有 C、D 和 E),那么你可以只取 A 和 B 的比例,然后再比较 50 %。
因此,这些案例减少到一个样本比例测试,通过搜索该术语可以找到许多有用的页面(不仅是带有工作示例的教程页面,还有视频),但让我给你一个粗略的大纲这里涉及到哪些计算。
把它想象成抛硬币可能会有所帮助。如果我投掷一枚公平的硬币 586 次,“正面”的合理概率是多少?如果我们在头部画一个“A”,在另一侧画一个“B”,我们将记录我们看到的“A”的比例,当它们同样可能时。
如果我们这样做“抛一枚公平的硬币 586 次并计算正面(A)的比例”,这就是正面比例分布的样子……然后重复实验一万次:

这表明在您的总数为 586 的示例中,如果 A 和 B 的可能性相同,则 A 的比例几乎总是在 45% 到 55% 之间,并且基本上永远不会超过 40% 到 60%(在万次实验)。
如果您的样本量(在您的示例中为 586)不是太小 - 超过 10-15 应该就足够了 - 您可以使用样本比例的正态近似值。
如果是样本比例 (512/586) 和是假设的“无差异”比例(50%),可以计算:
并使用普通表计算差异是否超出偶然性可以解释的范围。
在你的例子中,
您可以非常安全地得出结论,该比例与 50% 不同——因此通过检查高于 50%——因此它在逻辑上也必须高于 B。(可以对 A 和 B 的差异进行显式测试比例,但它给出的结果与通常的一个样本测试相同,所以你不妨做“标准”的事情。)
见http://en.wikipedia.org/wiki/Statistical_hypothesis_testing
在 5% 的典型显着性水平下,您会得出 A 比例不同于 50% 的结论,如果大于 1.96(在该样本量下,A 计数为 317 或更多或 269 或更少会导致您得出 A 比例不同于 50% 的结论)。
很难说你已经知道了多少,所以我会让你提出问题来指导你需要多少细节。
您无需为此测试获取或学习复杂的软件;例如,如果您已经拥有类似的东西,您可以轻松地手动或在 Excel(或类似 LibreOffice 的 Calc 之类的免费等效工具)中完成。(但是,如果您想尝试一下,R 包是免费的,而且功能非常强大,并且被统计学家广泛使用——因此很容易在网上找到有关它的帮助。)
如果您有 Excel,则可以使用计算p 值NORMSDIST。
在小样本中,您不能使用正态近似值,而应该使用精确的二项分布,但同样,这在 Excel 之类的东西中相当简单。
[如果您的样本量适中——比如在 15 到 50 之间——我建议对正态近似值使用连续性校正,或者使用精确的二项式。一旦你过去了(占 50% 的比例),通常不会有足够的区别来打扰。]
您的老师所指的“统计测试”将是二项式测试。这是一个精确检验,这意味着它会产生在原假设下发生的观察比例(或更极端的比例)的精确概率(p 值)。在这种情况下,您的零假设似乎是选择 A 类(或 B)的人的比例是 0.50。
例如,在 R 中,您将按如下方式运行测试:
binom.test(x=512, n=586, p=.5, alternative="two.sided")
这会产生p < .001,这意味着如果总体中的真实比例是 0.50,那么在选择 A 类的人数(或更极端的比例,即接近 1 或介于 0 和 1-.874 之间的比例)小于 0.001 - 一个非常小的概率。您会得出结论,人们“确实倾向于更关注 A 类而不是 B 类”。
有关运行测试的更多软件选项(例如 SPSS、SAS),请参见此处。