机器算法验证 - 相关研究的样本量计算 - 吾爱随笔录

相关研究的样本量计算

机器算法验证相关性样本量统计能力

2022-03-16 21:39:42

我正在计划一项研究来评估医学生的压力感知与他们的学业成绩之间的相关性。在文献回顾之后，似乎先前进行的一项近期研究报告了相关系数值为 0.47。但是当我通过一些在线计算器使用这个值来计算我所需的样本量时，我的 N 值只有 45。

不确定我是否做错了什么，有人可以指出相关研究中样本量计算的标准公式吗？

3个回答

我会谨慎使用已公布的 r 值 0.47 作为样本量计算的基础。

如果真正的相关性是 0.25 怎么办？如果这是真正的人口相关性，您是否希望您的研究找到一个“显着”的结果？如果是这样，计算 r = 0.25（或更小）的样本量。更一般地说，尝试找到可以检测（以合理的功效）您会关心的最小效应（此示例的相关系数）的样本量。

要运行功率分析，您需要知道四个中的三个来计算最后一个：

观察次数
影响大小（相关系数）
显着性水平
力量

您已将问题中的效应大小（相关系数）设为 0.47。接下来，让我们决定使用传统的显着性水平。功率的典型选择是。使用 R 中的库pwr，我们得到 $\alpha = 0.05$ $p = 0.8$

> pwr.r.test(n=NULL, r=0.47, sig.level=0.05, power=0.80, alternative="two.sided")

     approximate correlation power calculation (arctangh transformation) 

              n = 32.38727
              r = 0.47
      sig.level = 0.05
          power = 0.8
    alternative = two.sided

或者，我们可以设置阈值上限：

> pwr.r.test(n=NULL, r=0.47, sig.level=0.05, power=0.95, alternative="two.sided")

     approximate correlation power calculation (arctangh transformation) 

              n = 52.12905
              r = 0.47
      sig.level = 0.05
          power = 0.95
    alternative = two.sided

您不需要非常大的样本量，因为已经是非常强的关系。 $r=0.47$

这是另一个使用图形表示的 GPower 的示例，其中样本大小与功效：

在此处输入图像描述

45 个样本似乎是合理的，功效 > 0.9。

其它你可能感兴趣的问题

上一篇寻找适合sigmoid曲线的函数下一篇我应该对高度偏斜和离散的数据使用 t 检验吗？