机器算法验证 - 是否报告影响大小的置信区间，例如和？rrη2η2 - 吾爱随笔录 - 问答

是否报告影响大小的置信区间，例如和？rrη2η2

机器算法验证置信区间规模效应

2022-03-30 14:47:44

我计算了和之间的双变量线性相关系数，它是；。 $x$ $y$ $r= 0.45$ $p<001$

我知道是效应大小的量度。 $r$

在这种情况下，我是否也应该报告置信区间？

如果是，如何证明是合理的？ )一起报告很重要- 一些非统计解释肯定对我非常有用。 $r$

和的线性回归分析也是如此。我正在报告统计数据，和。 $x$ $y$ $F$ $p<0.05$ $\eta^2$

我还应该计算线性回归分析的置信区间吗？

2个回答

答案几乎总是：报告两者。这样，您的听众可以决定您的结果的趣味性和重要性，而不必仅仅相信您。置信区间同样总是有用的，因为它们在一个中给出了效果大小和重要性的简洁指示。如果它在图表上就更好了:)

最好查看所有可能的结果，记住显着性水平（）是一个任意阈值，你可以选择任何你喜欢的人（更高的当然更难捍卫）。 $\alpha$

低 p 值，低效应量：你已经得到了一个结果，你很确定这不是偶然的，但它并没有真正说明任何有趣的事情。一个例子可能是一种新药，它显着改善了旧药。但是，如果改进仅为 2%，那么与其他因素（如额外成本或新的副作用）相权衡时，您的结果可能意义不大
高 p 值，高效应量：看起来你正在做某事，但你不能肯定地说这不仅仅是偶然的结果。对于这种药物，事情看起来很有希望，但你肯定想要做更多的测试，可能通过一个修改过的实验（希望）会减少你看到的一些荒谬的可变性。
高 p 值，低效应量：这里没什么有趣的。去设计一个更好的实验。
低 p 值，大效应量：赢。你有很大的影响，而且你确信这不是偶然的。如果它是一种新药，那么你的结果很有可能会产生重大影响，并且它会很快推向市场，即使它成本更高，或者有一些副作用。

（注意：不要在这里推销药物，我和下一个对大型制药公司的偏执狂一样不信任，但药物是很好的统计例子：）

是的，您应该计算统计数据的间隔。困难的部分是不证明间隔演示是合理的，要证明不演示它会更加困难。您作为数据模型计算的确切效应大小、平均值或任何统计数据很可能不是真实值。计算间隔反映了 A）您知道它不是真实值，并且 B）这是您认为真实值所在的区域。您计算的值周围的区间允许人们在简单的显着性检验之外做出推断，并表明实验的力量。

此外，正如您所描述的，对于简单的线性回归，通常最好报告 beta 系数和置信区间。您还可以针对您选择的任何效果大小报告一个。如果您的预测器是连续的，那么很难想象 CI 的样子，最好将其绘制出来。您的 stats 包应该能够帮助解决这个问题。例如，在 R 中，您可以让 predict() 返回 CI 值以进行绘图。

其它你可能感兴趣的问题

上一篇子样本自举下一篇为什么不是所有测试都通过项目分析/响应理论进行评分？