如何计算比较两组问卷平均分数所需的参与者人数?

机器算法验证 统计学意义 样本量 民意调查 t检验 统计能力
2022-04-21 08:34:48

我必须创建一份调查问卷,比较 Facebook 用户与非 Facebook 用户的运动性。我需要计算所需的参与者数量,以便结果具有统计相关性。不幸的是,我不知道如何计算。你可以帮帮我吗?

4个回答

定义问题

  • 我猜你正在以某种形式的多项目量表来衡量运动性。因此,您将获得运动性的数字度量。我假设您将运行独立组 t 检验来测试组均值之间的差异。

  • 您的问题是先验功率分析的一种形式。要确定您需要指定的样本量:

    1. 您想要的统计功效(通常 80% 被认为是足够的)
    2. 您的预期效果大小(通常指定为标准化组均值差;当然这不是提前知道的,因此您必须考虑您认为有趣的最小效果是什么)
    3. 显着性检验的 alpha 水平(通常为 0.05)

软件选项

  • 用于计算统计功效的免费G​​UI 是Mac 和 Windows 上可用的G Power 3 。我通过与您的示例相关的一些样本功率分析图(标准化组平均差异)解释了基本用法。

  • R也有选项,如关于 power analysis 的 quick-r 页面所总结的。查看包装中的一个选项pwr.t.testpwr

  • 基本规则是参与者越多越好,任何功效分析都基于未知的人口效应假设(如果已知,则无需进行研究)。

示例:

> install.packages("pwr")
> library(pwr)
> pwr.t.test(power= .8, d=.5, sig.level=.05, type="two.sample")

     Two-sample t test power calculation    
              n = 63.76561
              d = 0.5
      sig.level = 0.05
          power = 0.8
    alternative = two.sided    
 NOTE: n is number in *each* group 

因此,假设通常被标记为组均值与 alpha 和功率的常规值的中等差异,则每组需要 64 名参与者。

来自 G Power 的图表

下图由 G Power 生成,取自我关于 power analysis 的帖子

它显示了对于不同水平的 d,对于给定的总样本量,您将获得什么功效。

不同 d 的功率分析图

非实验设计的最终并发症

上述计算都是在假设您的样本中有相同数量的 facebook 和非 facebook 用户的情况下完成的。此功能对于以某种系统方式对参与者进行抽样的实验和研究来说很常见。但是,如果您只是从社区中获取一般样本,您最终会得到数量不均的 facebook 和非 facebook 用户。

在其他条件相同的情况下,随着组大小变得不相等,统计功效会降低。G Power 3 允许您在计算所需样本量时指定组大小的比率。

这是一个可以为您执行此操作的网站的链接,但它是德语的... :-\ 但是您可以使用它...

http://www.bauinfoconsult.de/Stichproben_Rechner.html

该站点根据标准误差和预期功效计算所需受访者的数量。

这是一个非常古老的问题,但由于我知道并使用了一种直接的计算方法,我想根据您是否希望有一个双面或单面假设来分享它。让我们帮助那些也想知道答案的人。

无论如何,现在为了让事情更简单,让的组(fb 用户与非 fb 用户)之间的平均差δσ

根据调查的简洁性,现在只需选择这些: 对于 95% 的最常见置信水平,即α0.05。就像我们为α选择电源即1β为 80% (0.8) 显然对应于β20% (0.2)。

最后,样本量由公式给出(类似于Lehr's)n=[(z1α+z1β)σδ]2

看看我之前写的这个例子。另请注意,而不是z1αandz1β我把它误认为zαzβ分别,但这里的想法保持不变。

在此处输入图像描述

这是英文版

问卷或调查样本量 您如何确定用于调查的样本量?这实际上是一个复杂的计算。因此,根据我的经验,人们使用经验法则——比如 10%。这样的经验法则不能指望对所需样本量给出足够的估计,因此人们要么样本不足,要么样本过多。通常这些样本太小 - 导致不适当的决定 - 或太大 - 浪费精力和费用。

你应该采取多大的样本量?答案是在你对“误报”和“误报”的不容忍之间取得平衡。

您还可以在 gpra.net 上尝试样本大小计算器- 这是介绍安装PDF