生态学家是唯一不知道反正弦是正弦的人吗?

机器算法验证 回归 方差分析 数据转换 广义线性模型
2022-03-21 12:45:07

比例、比率和百分比数据在生态学中非常常见(例如,授粉的花百分比、男性:女性性别比、响应治疗的死亡率百分比、食草动物吃掉的叶子百分比)。一些应用统计学家最近在《生态学》杂志上发表了一篇题为“反正弦是正弦:生态学中的比例分析”的文章。他们指出,反正弦变换已被 Zar 的“Biostatistical Analysis”和 Sokal 和 Rohlf 的“Biometry”(均在他们的第 3 版或第 4 版中)等长期运行的文本所推动,但这种技术已被广义线性模型和更好的计算所淘汰。 :

在分析生态学中的比例数据时,反正弦平方根变换一直是标准程序,应用于包含二项式和非二项式响应变量的数据集中。在这里,我们认为在任何一种情况下都不应该使用反正弦变换。对于二项式数据,逻辑回归比转换数据的分析具有更大的可解释性和更高的功效。[...] 对于非二项式数据,反正弦变换是不可解释的,因为它会产生无意义的预测。提出了 logit 变换作为解决这些问题的替代方法。

我想知道其他领域(心理?医学?)中的比例数据有多常见?反正弦法在其他领域中是否仍然普遍使用,或者生态学家在使用这种(或其他)过时或不是最佳技术方面是否特别出色?是否有其他领域的论文强调需要使用更先进的技术?

3个回答

我把它教给公共卫生学生有两个原因:

  • 我的一位同事(在介绍课程中)将它作为神奇的秘诀教授,我向他们展示了 Delta 方法以及它是如何推导出来的;

  • 我认为 Delta 方法和方差稳定转换并不简单,而且很有用。使用带有连续性校正的反正弦变换计算的置信区间并不完美,但表现得相当不错,对于小样本,它比仍然广泛使用的 Wald 过程要好得多。

作为心理学和神经科学的约翰,我认为许多流行病学家甚至都不在乎,他们只是以按钮的方式使用线性模型。

¹ Pires, Amado, 2008。二项式比例的区间估计。

我可以根据经验说,心理学和神经科学通常甚至不努力转换 % 值以使其正常化。模态分析是 %correct 或 %error 的 ANOVA 或 t 检验。

关于反正弦变换在生态学和其他领域的流行程度的问题可以通过访问 JStor、挑选一些期刊并在过去 20 年中搜索这个词来衡量。

可以通过指出不使用 arcsin 的一个(众多)原因来澄清对该主题的讨论。比例是根据案件的数量而定的。你会给 4 个案例中的 2 个(不太可靠)的比例和 40 个案例中的 20 个更可靠的比例赋予相同的权重吗?自然的解决方案是使用优势和优势比,以及二项分布来测试作为优势变化的比例变化,如 arcsin asinine 出版物中所述。这样你就给了 40 的 50%,而 4 的 50%。