统计软件包如何计算功效

机器算法验证 统计能力
2022-04-06 07:59:27

统计软件包如何计算功效?例如,假设我们有一个样本X100观察。我们假设他们来自一个正态分布的人口(iid)。我们的假设检验是H0:μ=6对比Ha:μ6. 假设原假设被拒绝。软件包如何计算正确拒绝原假设的概率?它不是必须对不同的样本重复执行相同的假设检验吗?或者是否可以通过仅对一个样本进行假设检验来计算功效?

1个回答

您是正确的,执行功率分析的一种方法是通过仿真。您可以从一个分布中重复生成 100 个观测值,并根据原假设检验这些观测值。如果它始终报告(真实)差异,您可以说该测试具有高功效。

但是,对于许多常见测试,例如 t 检验,功效/所需样本量是通过分析计算得出的。如果你看一个人的“胆量”t-statistic,它基于以下几点:

  • “效应量”ES: 在你的例子中,(X6)¯
  • 样本量n: 100 在你的例子中,但非常必要!
  • 样本方差sn:在你的例子中没有给出
  • 显着性水平/第一类错误率α: 通常为 0.05

该测试通过比较来工作

t=ESnsn
达到“临界值”tcrit这取决于αn. 你可以很容易地重新安排这个来解决n对于其他参数的特定值,并使用更多的数学运算,将其扩展为直接计算功率。

John M. Lachin的这一章包含更多细节。