是否报告影响大小的置信区间,例如和?rrη2η2

机器算法验证 置信区间 规模效应
2022-03-30 14:47:44

我计算了之间的双变量线性相关系数,它是 xyr=0.45p<001

我知道是效应大小的量度。r

在这种情况下,我是否也应该报告置信区间?

如果是,如何证明是合理的? )一起报告很重要- 一些非统计解释肯定对我非常有用。r

的线性回归分析也是如此我正在报告统计数据,xyFp<0.05η2

我还应该计算线性回归分析的置信区间吗?

2个回答

答案几乎总是:报告两者这样,您的听众可以决定您的结果的趣味性和重要性,而不必仅仅相信您。置信区间同样总是有用的,因为它们在一个中给出了效果大小和重要性的简洁指示。如果它在图表上就更好了:)

最好查看所有可能的结果,记住显着性水平()是一个任意阈值,你可以选择任何你喜欢的人(更高的当然更难捍卫)。α

  1. 低 p 值,低效应量:你已经得到了一个结果,你很确定这不是偶然的,但它并没有真正说明任何有趣的事情。一个例子可能是一种新药,它显着改善了旧药。但是,如果改进仅为 2%,那么与其他因素(如额外成本或新的副作用)相权衡时,您的结果可能意义不大

  2. 高 p 值,高效应量:看起来你正在做某事,但你不能肯定地说这不仅仅是偶然的结果。对于这种药物,事情看起来很有希望,但你肯定想要做更多的测试,可能通过一个修改过的实验(希望)会减少你看到的一些荒谬的可变性。

  3. 高 p 值,低效应量:这里没什么有趣的。去设计一个更好的实验。

  4. 低 p 值,大效应量:赢。你有很大的影响,而且你确信这不是偶然的。如果它是一种新药,那么你的结果很有可能会产生重大影响,并且它会很快推向市场,即使它成本更高,或者有一些副作用。

(注意:不要在这里推销药物,我和下一个对大型制药公司的偏执狂一样不信任,但药物是很好的统计例子:)

是的,您应该计算统计数据的间隔。困难的部分是不证明间隔演示是合理的,要证明不演示它会更加困难。您作为数据模型计算的确切效应大小、平均值或任何统计数据很可能不是真实值。计算间隔反映了 A)您知道它不是真实值,并且 B)这是您认为真实值所在的区域。您计算的值周围的区间允许人们在简单的显着性检验之外做出推断,并表明实验的力量。

此外,正如您所描述的,对于简单的线性回归,通常最好报告 beta 系数和置信区间。您还可以针对您选择的任何效果大小报告一个。如果您的预测器是连续的,那么很难想象 CI 的样子,最好将其绘制出来。您的 stats 包应该能够帮助解决这个问题。例如,在 R 中,您可以让 predict() 返回 CI 值以进行绘图。