我在阅读sciencemag.org 上的一篇文章时遇到了这句话。
最后,仅包括来自 12 个国家/地区的 7600 名研究人员的回复,因为其余数据被认为没有统计学意义。
这是进行研究的正确方法吗?忽略结果,因为它们不被认为具有统计学意义?
我在阅读sciencemag.org 上的一篇文章时遇到了这句话。
最后,仅包括来自 12 个国家/地区的 7600 名研究人员的回复,因为其余数据被认为没有统计学意义。
这是进行研究的正确方法吗?忽略结果,因为它们不被认为具有统计学意义?
这句话实际上没有意义,显然是错误的。
数据不能在统计上显着或不显着。只有数据之间的关系,即统计检验的产物,才能用这些术语来表述。
如果问题是:我们是否可以从分析中删除数据,因为包含该数据意味着我们不能拒绝原假设?答案是——显然,我希望!——不。您引用的消息是新闻报道,而不是科学论文。如果这是一篇经过审查的论文,它永远不会进入。
可能没有包括数据,因为有实质性的理由不包括这些数据。正如其他人所建议的那样,排除的数据可能不完整或使用不同或无法比较的方法收集。
不。
我怀疑记者的意思是说其他人被排除在外是因为调查不完整或内部不一致。
在whuber 的评论中引用的报告中,它在第 104 页 [pdf 中的第 114 页] 上说:
该调查成功地激活了来自 30 多个国家的约 8,900 名博士候选人的参与...
然后,跨越第 104-105 页,它说:
在执行数据清理程序时,Eurodoc 调查专家团队决定进行功率测试分析。基于完全完成的问卷将导致多正态分布的假设,使用了用于估计置信区间的功效检验。这样做是为了测试数据的准确性。决定在 95% 的置信区间内接受最大 6% 的错误水平。16% 的抽样规模损失导致 12 个参与国家的样本有 7,600 名参与者。
因此,尚不清楚样本中 16% 损失的确切原因,但不完整响应的假设可能是正确的。(你可以看到为什么记者感到困惑。)
不,但记者可以完全无意义地使用技术术语。