什么是 logworth 统计量,它有多大用处?

数据挖掘 统计数据
2021-10-07 03:43:09

我的老师今天提到了它,除了在 SAS 和 JMP 文档中各提到一个之外,它的好的搜索结果几乎为零。

它说是-log10(p-value),但网上几乎没有解释。此外,这个统计数据似乎被广泛忽视。在过去两年我读过的任何教程或任何数据科学论文中都没有提到它。

问题

那么,这个统计数据是什么,它来自哪里?它在数据科学中有多大用处?

2个回答

logworth 是基于 Pearson 卡方检验的 p 值变换。

Pearson 卡方检验评估由偶然造成的分裂的概率。Pearson 卡方值越高,分裂由依赖引起的可能性就越大。根据卡方分数和自由度给出 p 值。

由于某些数据可能具有高依赖关系,因此 p 值可能非常小。取一个 p 值 (-log(p-value)) 的对数值可以让我们减轻这个极低的值。

如果 p 是来自有效拟合测试的 p 值,则可以通过香农变换 s = -log2(p) = log10 将 logworth 转换为针对测试提供的模型的信息位数的度量(p)/log10(2),也称为测试中的二元意外或 S 值。有关此度量的详细讨论,请参见 Greenland, S., 2019。有效的 P 值完全符合其应有的行为:对 P 值的一些误导性批评及其与 S 值的分辨率。是。统计。第 73 页,第 106–114 页。https://doi.org/10.1080/00031305.2018.1529625 和 Rafi, Z., Greenland, S., 2020。帮助统计科学的语义和认知工具:用兼容性和惊喜代替信心和意义。BMC 研究方法论,出版中。https://arxiv.org/abs/1909.08579