使用中值和图形表示报告错误?

机器算法验证 数据可视化 中位数 错误
2022-03-24 02:17:54

我对我的论文数据使用了广泛的测试,从参数方差分析和 t 检验到非参数 Kruskal-Wallis 检验和 Mann-Whitneys,以及秩变换的 2 路 ANOVA 和带有二进制的 GzLM,泊松和比例数据。现在,当我将所有这些都写在结果中时,我需要报告所有内容。

我已经在这里询问过如何报告比例数据的不对称置信区间。我知道标准差、标准误差或置信区间适用于均值,如果我的所有测试都很好地参数化,我会报告这些。但是,对于我的非参数测试,我应该报告中位数而不是平均值吗?如果是这样,我会用它报告什么错误?

与此相关的是如何最好地以图形方式呈现非参数测试结果。由于我在类别中主要有连续或间隔数据,因此我通常使用条形图,条形图的顶部是平均值,误差条显示 95% CI。对于 NP 测试,我仍然可以使用条形图,但条形的顶部代表中位数吗?

感谢您的建议!

1个回答

您可以报告中位数的置信区间。在 R 中,您可以wilcox.test与参数一起使用conf.int=TRUEJohn VerzanisimpleR 笔记中对此进行了少量讨论:请参见此处

关于图:我不太喜欢使用条形图来表示一组均值。我宁愿只为 CI 绘制小线段: 条形图改进

右边的图是用errbar()Hmisc[ CRAN 页面] 制作的。

您可以为中位数和相关置信区间制作相同类型的图,或者您可以使用箱线图(在相同的空间中,描述整个分布)。